Finware
  • Beranda
  • Riwayat
  • Disimpan
  • Feed
  • Topik Pilihan
  • News
  • Market
  • Bisnis
  • Kripto
  • Tech
Pemberitahuan
FinwareFinware
  • News
  • Market
  • Bisnis
  • Kripto
  • Tech
Search
  • Quick Access
    • Beranda
    • Contact Us
    • Riwayat
    • Disimpan
    • Topik Pilihan
    • Feed
  • Categories
    • News
    • Market
    • Bisnis
    • Kripto
    • Tech

Artikel Populer

Jangan lewatkan artikel menarik lainnya
Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Reihan
19 April 2026
Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Dirga
27 Maret 2026
Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

Dirga
31 Maret 2026
© 2026 Finware Media. All Right Reserved.
Finware > Bisnis > OpenAI Luncurkan GPT-5.5: Kinerja Lebih Unggul dari Claude Mythos Preview di Terminal-Bench 2.0!
Bisnis

OpenAI Luncurkan GPT-5.5: Kinerja Lebih Unggul dari Claude Mythos Preview di Terminal-Bench 2.0!

Keenan
Terakhir diperbarui: 24 April 2026 3:18 AM
Oleh
Keenan
12 Menit Baca
Bagikan
OpenAI Luncurkan GPT-5.5: Kinerja Lebih Unggul dari Claude Mythos Preview di Terminal-Bench 2.0!
Bagikan

Setelah berbulan-bulan rumor dan laporan bahwa OpenAI sedang mengembangkan model AI besar dengan kemampuan lebih kuat untuk digunakan di ChatGPT dan melalui antarmuka pemrograman aplikasi (API), yang diduga mempunyai nama kode “Spud”, perusahaan ini akhirnya mengungkap produk terbarunya dengan nama resmi GPT-5.5.

Table of Content
  • Fokus pada kinerja otonom
  • OpenAI kembali memimpin di pasar LLM yang paling kuat
  • Biaya meningkat untuk pengguna
  • Lisensi dan “perbatasan siber-permissif”
  • Reaksi awal: kehilangan akses terasa seperti “anggota tubuh diamputasi”

Tidak mengejutkan, GPT-5.5 kembali memimpin di antara model-model AI yang tersedia secara umum, melampaui pesaing seperti Anthropic dan Google, bahkan mengalahkan model pribadi dari Anthropic, yaitu Claude Mythos Preview, di satu metrik pengujian.

“Ini adalah model terkuat yang pernah kami buat untuk coding, baik dari segi standar pengujian maupun umpan balik yang kami terima dari mitra terpercaya,” jelas Amelia “Mia” Glaese, VP Riset di OpenAI, dalam panggilan video dengan wartawan sebelum peluncuran hari ini.

OpenAI memposisikan GPT-5.5 sebagai desain ulang fundamental tentang bagaimana kecerdasan berinteraksi dengan sistem operasi komputer dan tumpukan perangkat lunak profesional.

“Yang membuat model ini khusus adalah betapa banyaknya yang dapat dilakukannya dengan bimbingan yang lebih sedikit,” ungkap co-founder dan presiden OpenAI, Greg Brockman, dalam panggilan yang sama. “Model ini jauh lebih intuitif untuk digunakan. Ia dapat melihat masalah yang tidak jelas dan menentukan apa yang perlu dilakukan selanjutnya.”

Brockman juga menekankan area di mana pengguna bisa berharap mendapatkan keuntungan dari menggunakan GPT-5.5 dibandingkan model sebelumnya, GPT-5.4, yang masih tersedia (untuk saat ini) dengan biaya setengah dari API model baru ini.

“Model ini sangat baik dalam coding,” kata Brockman tentang GPT-5.5. “Ia juga hebat dalam pekerjaan komputer lebih luas, penggunaan komputer, dan penelitian ilmiah—aplikasi-aplikasi jenis ini yang seringkali menjadi hambatan kecerdasan.”

CEO dan co-founder OpenAI, Sam Altman, juga memberikan pandangannya tentang peluncuran ini di postingan di X, menulis, “Kami ingin pengguna kami memiliki akses ke teknologi terbaik dan setiap orang memiliki kesempatan yang sama.”

Model ini hadir dalam dua varian: GPT-5.5 dan GPT-5.5 Pro, di mana yang terakhir menawarkan presisi lebih serta logika khusus untuk menangani tuntutan kognitif yang paling ketat.

Sementara versi standar berfungsi sebagai flagship yang serbaguna untuk tugas-tugas kecerdasan umum, model Pro dirancang khusus untuk lingkungan berisiko tinggi seperti penelitian hukum, ilmu data, dan analisis bisnis tingkat lanjut di mana akurasi sangat penting. Tingkat premium ini memberikan respons yang lebih komprehensif dan terstruktur dengan baik, didukung oleh optimasi latensi khusus yang memastikan kinerja berkualitas tinggi selama alur kerja kompleks dan bertahap.

Sayangnya, akses API untuk GPT-5.5 dan GPT-5.5 Pro belum tersedia bagi pengembang perangkat lunak pihak ketiga dan akan segera hadir, menurut pengumuman OpenAI.

Read more  Lima Tanda Data Drift yang Mengancam Model Keamanan Anda

“Implementasi API memerlukan langkah-langkah pengamanan yang berbeda, dan kami bekerja sama dengan mitra dan pelanggan untuk memenuhi persyaratan keamanan dan keselamatan dalam penyajian ini secara berskala,” tulis OpenAI.

Saat ini, GPT-5.5 hanya tersedia bagi pelanggan yang membayar ChatGPT Plus ($20 per bulan), Pro ($100-$200 per bulan), serta pengguna bisnis dan enterprise, dengan akses GPT-5.5 Pro dimulai dari tingkat Pro dan lebih tinggi.

Fokus pada kinerja otonom

Di inti GPT-5.5 terdapat fokus pada kinerja “agen”—secara spesifik dalam coding, penggunaan komputer, dan penelitian ilmiah.

Berbeda dengan pendahulunya yang sering memerlukan permintaan langkah-demi-langkah untuk menghindari “halusinasi”, GPT-5.5 dirancang untuk menangani tugas-tugas rumit secara mandiri.

Model ini unggul dalam penelitian daring, debugging kode kompleks, dan berpindah antar dokumen dan spreadsheet tanpa intervensi manusia.

Salah satu lompatan teknis paling signifikan adalah efisiensinya. Meskipun model yang lebih besar biasanya mengalami latensi yang meningkat, GPT-5.5 dapat menyamai kecepatan latensi per token dari model GPT-5.4 sebelumnya sambil memberikan tingkat kecerdasan yang lebih tinggi.

Ini dicapai melalui desain bersama perangkat keras dan perangkat lunak yang mendalam. OpenAI menyajikan GPT-5.5 di sistem NVIDIA GB200 dan GB300 NVL72, memanfaatkan algoritma heuristik khusus yang ditulis oleh AI itu sendiri untuk membagi dan menyeimbangkan tugas di antara inti GPU.

Optimasi ini dikabarkan telah meningkatkan kecepatan penghasil token lebih dari 20%. Untuk pemikiran yang melibatkan alasan tingkat tinggi, mode “GPT-5.5 Thinking” dalam ChatGPT memberikan jawaban yang lebih cerdas dan ringkas dengan memberikan model waktu pemrosesan internal yang lebih lama untuk memverifikasi asumsi sebelum memberikan respons.

Kemampuan ini sangat terlihat dalam kinerja model pada “Expert-SWE,” sebuah benchmark internal OpenAI untuk tugas coding jangka panjang dengan waktu penyelesaian median manusia selama 20 jam. GPT-5.5 secara signifikan mengungguli GPT-5.4 di métrik ini sambil menggunakan token yang jauh lebih sedikit.

OpenAI kembali memimpin di pasar LLM yang paling kuat

Pasar untuk model-model frontier yang dibuat di AS telah menjadi perlombaan ketat antara OpenAI, Anthropic, dan Google.

Pekan lalu, Anthropic meluncurkan Opus 4.7, model terkuat yang tersedia untuk umum, yang mengambil alih posisi teratas berdasarkan jumlah pengujian benchmark pihak ketiga yang berhasil dilaluinya.

Namun hari ini, GPT-5.5 telah melampauinya dan bahkan model Claude Mythos Preview milik Anthropic yang lebih kuat dan dibatasi, meski hanya di satu benchmark, Terminal-Bench 2.0, yang menguji “kemampuan model untuk menavigasi dan menyelesaikan tugas di lingkungan terminal yang terkurung.”

GPT-5.5 mencapai akurasi 82,7% di Terminal-Bench 2.0, jauh mengungguli Opus 4.7 (69,4%) dan mengalahkan Mythos Preview (82,0%) dengan tipis.

Read more  Peta Akrual Ethereum Ungkap Rencana Harga Menuju $20.000

Namun, dalam alasan multidisiplin tanpa alat, persaingan lebih ketat. Dalam Humanity’s Last Exam tanpa alat, GPT-5.5 Pro mencetak 43,1%, tertinggal dari Opus 4.7 (46,9%) dan Mythos Preview (56,8%).

Ini menunjukkan bahwa meskipun OpenAI menang dalam “penggunaan komputer” dan “agen,” model lain mungkin masih memiliki keunggulan dalam pengetahuan akademis tanpa alat.

Penting untuk dicatat bahwa Mythos Preview bukanlah produk yang tersedia secara umum; Anthropic mengklasifikasikannya sebagai aset defensif strategis karena risiko keamanan sibernya yang tinggi, membatasi aksesnya pada sekumpulan kecil mitra terpercaya dan lembaga pemerintah.

Karena Mythos tidak termasuk dalam penggunaan komersial yang luas, kompetisi pasar utama tetap antara GPT-5.5, Gemini 3.1 Pro, dan Claude Opus 4.7.

Ketika datang ke model yang dapat diakses oleh publik, GPT-5.5 kembali meraih mahkota bagi OpenAI, mencapai status tertinggi di 14 benchmark dibandingkan 4 untuk Claude Opus 4.7 dan 2 untuk Google Gemini 3.1 Pro.

GPT-5.5 mendominasi dalam penggunaan komputer yang otonom, pekerjaan pengetahuan ekonomi (GDPval), keamanan siber khusus (CyberGym), dan matematika kompleks (Frontier Math).

Sementara Claude Opus 4.7 memimpin dalam rekayasa perangkat lunak dan pemikiran tanpa alat, Gemini 3.1 Pro unggul dalam tiga kategori, khususnya dalam pemikiran akademis dan analisis keuangan.

Biaya meningkat untuk pengguna

Pergeseran dalam kecerdasan ini datang dengan peningkatan biaya yang signifikan untuk pengembang API, menurut informasi yang dibagikan OpenAI menjelang peluncuran publik model ini.

OpenAI telah menggandakan harga masuk untuk model flagship-nya dibandingkan generasi sebelumnya, dan lagi menggandakannya dari situ untuk varian model paling mutakhir, GPT-5.5 Pro:

Model

Harga Input (per 1M token)

Harga Output (per 1M token)

GPT-5.4

$2,50

$15,00

GPT-5.5

$5,00

$30,00

GPT-5.5 Pro

$30,00

$180,00

Untuk mengurangi biaya ini, OpenAI menekankan bahwa GPT-5.5 lebih “efisien token”, yang berarti menggunakan lebih sedikit token untuk menyelesaikan tugas yang sama dibandingkan GPT-5.4.

Bagi pengguna yang mengutamakan kecepatan dibandingkan kedalaman, OpenAI juga memperkenalkan mode Cepat di Codex, yang menghasilkan token 1,5 kali lebih cepat namun dengan biaya 2,5 kali lebih tinggi.

Tier “mini” dan “nano” yang ada di era GPT-5.4 (dihargai $0,75 dan $0,20 per 1M token input) saat ini tidak memiliki padanan GPT-5.5, meskipun perusahaan mencatat bahwa GPT-5.5 sedang diluncurkan untuk semua tier berlangganan, termasuk Plus, Pro, dan Enterprise.

Lisensi dan “perbatasan siber-permissif”

Pendekatan OpenAI terhadap keselamatan dan lisensi untuk GPT-5.5 memperkenalkan konsep baru: Akses Terpercaya untuk Siber. Karena model ini kini mampu mengidentifikasi dan menambal kerentanan keamanan yang canggih, OpenAI memberlakukan “klasifikasi risiko siber” yang lebih ketat untuk pengguna umum.

Bagi para profesional keamanan yang sah, OpenAI menawarkan lisensi “siber-permissif” khusus. Program ini memungkinkan pembela terverifikasi—yang bertanggung jawab atas infrastruktur kritis seperti jaringan listrik atau pasokan air—untuk menggunakan model seperti GPT-5.4-Cyber atau versi GPT-5.5 tanpa batasan yang lebih ketat terkait permintaan yang berkaitan dengan keamanan.

Read more  Panggilan Pasar Mingguan dari Investing.com: Temukan Peluang Investasi Terbaik!

Kerangka kerja penggunaan ganda ini mengakui bahwa meskipun AI dapat mempercepat pertahanan siber, ia juga dapat digunakan sebagai senjata. Dalam Kerangka Kerja Persiapan OpenAI, GPT-5.5 diklasifikasikan sebagai “Risiko Tinggi” untuk kemampuan biologis dan keamanan siber.

Untuk mengelola ini, implementasi API saat ini memerlukan langkah-langkah pengamanan yang berbeda dibandingkan ChatGPT yang ditujukan untuk konsumer, dan OpenAI bekerja dengan mitra pemerintah untuk memastikan bahwa alat-alat ini digunakan untuk memperkuat—bukan melemahkan—ketahanan digital.

Reaksi awal: kehilangan akses terasa seperti “anggota tubuh diamputasi”

Umpan balik awal dari pengguna dan insinyur menunjukkan bahwa GPT-5.5 telah melewati ambang psikologis dalam hal utilitas AI. Bagi para pengembang, kemampuan model ini untuk mempertahankan “kejelasan konseptual” di seluruh kode besar adalah fitur uniknya.

“Ini adalah model coding pertama yang saya gunakan yang memiliki kejelasan konseptual yang serius,” kata Dan Shipper, CEO dari Every.

Shipper menguji model ini dengan meminta untuk mendebug kegagalan sistem yang kompleks yang sebelumnya memerlukan tim insinyur manusia untuk menulis ulang; GPT-5.5 secara otonom menghasilkan perbaikan yang sama. Demikian juga, Pietro Schirano, CEO dari MagicPath, menggambarkan “perubahan langkah” dalam kinerja ketika model ini berhasil menggabungkan sebuah cabang dengan ratusan perubahan refaktor menjadi cabang utama dalam satu kali proses selama 20 menit. Reaksi paling mendalam datang dari seorang insinyur anonim di NVIDIA yang mendapatkan akses awal ke model.

“Kehilangan akses ke GPT-5.5 terasa seperti saya kehilangan anggota tubuh,” katanya.

Sentimen ini juga tercermin di komunitas ilmiah. Derya Unutmaz, seorang profesor di Jackson Laboratory for Genomic Medicine, menggunakan GPT-5.5 Pro untuk menganalisis kumpulan data yang berisi 28,000 gen, menghasilkan laporan dalam waktu menit yang biasanya akan memakan waktu berbulan-bulan bagi timnya.

Brandon White, CEO dari Axiom Bio, bahkan menyatakan bahwa jika OpenAI melanjutkan kecepatan ini, “fondasi penemuan obat akan berubah pada akhir tahun ini.”

GPT-5.5 lebih dari sekadar pembaruan bertahap; ia adalah alat yang dirancang untuk dunia di mana manusia mendelegasikan seluruh alur kerja, bukan sekadar permintaan tunggal. Meski biayanya lebih tinggi dan pengamanan lebih ketat, peningkatan kinerja dalam pekerjaan otonom menunjukkan bahwa AI akhirnya bergerak dari kotak percakapan ke dalam sistem operasi.

Mungkin yang paling mengejutkan, para peneliti di perusahaan ini menyatakan bahwa masih ada ruang untuk melatih model-model yang jauh lebih pintar dari ini.

“Kami sebenarnya masih memiliki kapasitas untuk melatih model yang jauh lebih pintar dari ini,” kata Jakub Pachocki, ilmuwan kepala OpenAI.

DITANDAI:featured
Bagikan Artikel Ini
Facebook Whatsapp Whatsapp LinkedIn Telegram Threads Salin Tautan
Avatar photo
OlehKeenan
Artikel eksklusif dari Keenan Prawira seputar tren bisnis terbaru, pendanaan startup, dan aksi korporasi. Insight esensial untuk para pemimpin bisnis modern.
Artikel Sebelumnya Hyundai dan ST Engineering Melobi Kontrak Kapal Perang Thailand senilai US$530 Juta Hyundai dan ST Engineering Melobi Kontrak Kapal Perang Thailand senilai US$530 Juta
Artikel Berikutnya Saham-Saham Dengan Pergerakan Terbesar Siang Ini: TXN, URI, WEX, PENN Saham-Saham Dengan Pergerakan Terbesar Siang Ini: TXN, URI, WEX, PENN
- Advertisement -
Ad image

Don't Miss

Mencoba YouTube Premium Gratis: Pengalaman Menggoda, Tapi Ada Satu Kendala yang Menghalangi Kembali!
Mencoba YouTube Premium Gratis: Pengalaman Menggoda, Tapi Ada Satu Kendala yang Menghalangi Kembali!
Tech
Bisnis Filipina Berharap Kebangkitan di 2026, Namun Harga Minyak Melonjak Tajam Semalam
Bisnis Filipina Berharap Kebangkitan di 2026, Namun Harga Minyak Melonjak Tajam Semalam
Market
Startup Tertekan Delve Resmi Berpisah dengan Y Combinator
Startup Tertekan Delve Resmi Berpisah dengan Y Combinator
Bisnis
- Advertisement -
Ad image

Baca Juga

Jelajahi insight lain yang sejalan dengan artikel ini!
Optimalkan Anggaran Komputasi AI Anda: Panduan Skala Train-to-Test untuk Inference yang Efisien
Bisnis

Optimalkan Anggaran Komputasi AI Anda: Panduan Skala Train-to-Test untuk Inference yang Efisien

Keenan
18 April 2026
Bisnis Anda Sudah Memiliki Aset AI Paling Berharga, Tapi Belum Dimanfaatkan Secara Optimal!
Bisnis

Bisnis Anda Sudah Memiliki Aset AI Paling Berharga, Tapi Belum Dimanfaatkan Secara Optimal!

Keenan
23 April 2026
Pengusaha Wajib Perhatikan Konsumsi Energi AI yang Semakin Melonjak
Bisnis

Pengusaha Wajib Perhatikan Konsumsi Energi AI yang Semakin Melonjak

Keenan
2 April 2026
Bitcoin ‘Sharks’ Penuhi Stok Secara Diam-diam di Tengah Ketidakpastian Pasar — Simak Selengkapnya
Kripto

Bitcoin ‘Sharks’ Penuhi Stok Secara Diam-diam di Tengah Ketidakpastian Pasar — Simak Selengkapnya

Rangga
25 April 2026
Sebagian Besar Perusahaan Tak Mampu Menangkal Ancaman Agen AI Tahap Tiga, Temuan Survei VentureBeat
Bisnis

Sebagian Besar Perusahaan Tak Mampu Menangkal Ancaman Agen AI Tahap Tiga, Temuan Survei VentureBeat

Keenan
19 April 2026
Rusia Hadapi Tantangan Ekonomi, Sipil, dan Politik di Tengah Perang Ukraina
Bisnis

Rusia Hadapi Tantangan Ekonomi, Sipil, dan Politik di Tengah Perang Ukraina

Keenan
25 April 2026
OpenAI Luncurkan GPT-Rosalind: Model Terbaru untuk Ilmu Hayat dan Plugin Codex yang Lebih Luas di Github
Bisnis

OpenAI Luncurkan GPT-Rosalind: Model Terbaru untuk Ilmu Hayat dan Plugin Codex yang Lebih Luas di Github

Keenan
17 April 2026
Redwood Materials Pangkas 10% Tenaga Kerja dalam Restrukturisasi untuk Fokus pada Bisnis Penyimpanan Energi
Bisnis

Redwood Materials Pangkas 10% Tenaga Kerja dalam Restrukturisasi untuk Fokus pada Bisnis Penyimpanan Energi

Keenan
22 April 2026
Tampilkan Lebih Banyak
- Advertisement -
Ad image
- Advertisement -
Ad image
Finware

Baca berita keuangan global real-time, insight market APAC, tren bisnis, dan crypto paling komprehensif. Curi start sebelum market bergerak.

  • Kanal:
  • Bisnis
  • Market
  • Kripto
  • News

Personal

  • Riwayat
  • Disimpan
  • Feed
  • Topik Pilihan

Tentang Kami

  • Beranda
  • Hubungi Kami

© 2026 Finware Media. All Right Reserved.

Welcome Back!

Sign in to your account

Nama Pengguna atau Alamat Email
Kata Sandi

Lupa kata sandi Anda?