Setelah berbulan-bulan rumor dan laporan bahwa OpenAI sedang mengembangkan model AI besar dengan kemampuan lebih kuat untuk digunakan di ChatGPT dan melalui antarmuka pemrograman aplikasi (API), yang diduga mempunyai nama kode “Spud”, perusahaan ini akhirnya mengungkap produk terbarunya dengan nama resmi GPT-5.5.
Tidak mengejutkan, GPT-5.5 kembali memimpin di antara model-model AI yang tersedia secara umum, melampaui pesaing seperti Anthropic dan Google, bahkan mengalahkan model pribadi dari Anthropic, yaitu Claude Mythos Preview, di satu metrik pengujian.
“Ini adalah model terkuat yang pernah kami buat untuk coding, baik dari segi standar pengujian maupun umpan balik yang kami terima dari mitra terpercaya,” jelas Amelia “Mia” Glaese, VP Riset di OpenAI, dalam panggilan video dengan wartawan sebelum peluncuran hari ini.
OpenAI memposisikan GPT-5.5 sebagai desain ulang fundamental tentang bagaimana kecerdasan berinteraksi dengan sistem operasi komputer dan tumpukan perangkat lunak profesional.
“Yang membuat model ini khusus adalah betapa banyaknya yang dapat dilakukannya dengan bimbingan yang lebih sedikit,” ungkap co-founder dan presiden OpenAI, Greg Brockman, dalam panggilan yang sama. “Model ini jauh lebih intuitif untuk digunakan. Ia dapat melihat masalah yang tidak jelas dan menentukan apa yang perlu dilakukan selanjutnya.”
Brockman juga menekankan area di mana pengguna bisa berharap mendapatkan keuntungan dari menggunakan GPT-5.5 dibandingkan model sebelumnya, GPT-5.4, yang masih tersedia (untuk saat ini) dengan biaya setengah dari API model baru ini.
“Model ini sangat baik dalam coding,” kata Brockman tentang GPT-5.5. “Ia juga hebat dalam pekerjaan komputer lebih luas, penggunaan komputer, dan penelitian ilmiah—aplikasi-aplikasi jenis ini yang seringkali menjadi hambatan kecerdasan.”
CEO dan co-founder OpenAI, Sam Altman, juga memberikan pandangannya tentang peluncuran ini di postingan di X, menulis, “Kami ingin pengguna kami memiliki akses ke teknologi terbaik dan setiap orang memiliki kesempatan yang sama.”
Model ini hadir dalam dua varian: GPT-5.5 dan GPT-5.5 Pro, di mana yang terakhir menawarkan presisi lebih serta logika khusus untuk menangani tuntutan kognitif yang paling ketat.
Sementara versi standar berfungsi sebagai flagship yang serbaguna untuk tugas-tugas kecerdasan umum, model Pro dirancang khusus untuk lingkungan berisiko tinggi seperti penelitian hukum, ilmu data, dan analisis bisnis tingkat lanjut di mana akurasi sangat penting. Tingkat premium ini memberikan respons yang lebih komprehensif dan terstruktur dengan baik, didukung oleh optimasi latensi khusus yang memastikan kinerja berkualitas tinggi selama alur kerja kompleks dan bertahap.
Sayangnya, akses API untuk GPT-5.5 dan GPT-5.5 Pro belum tersedia bagi pengembang perangkat lunak pihak ketiga dan akan segera hadir, menurut pengumuman OpenAI.
“Implementasi API memerlukan langkah-langkah pengamanan yang berbeda, dan kami bekerja sama dengan mitra dan pelanggan untuk memenuhi persyaratan keamanan dan keselamatan dalam penyajian ini secara berskala,” tulis OpenAI.
Saat ini, GPT-5.5 hanya tersedia bagi pelanggan yang membayar ChatGPT Plus ($20 per bulan), Pro ($100-$200 per bulan), serta pengguna bisnis dan enterprise, dengan akses GPT-5.5 Pro dimulai dari tingkat Pro dan lebih tinggi.
Fokus pada kinerja otonom
Di inti GPT-5.5 terdapat fokus pada kinerja “agen”—secara spesifik dalam coding, penggunaan komputer, dan penelitian ilmiah.
Berbeda dengan pendahulunya yang sering memerlukan permintaan langkah-demi-langkah untuk menghindari “halusinasi”, GPT-5.5 dirancang untuk menangani tugas-tugas rumit secara mandiri.
Model ini unggul dalam penelitian daring, debugging kode kompleks, dan berpindah antar dokumen dan spreadsheet tanpa intervensi manusia.
Salah satu lompatan teknis paling signifikan adalah efisiensinya. Meskipun model yang lebih besar biasanya mengalami latensi yang meningkat, GPT-5.5 dapat menyamai kecepatan latensi per token dari model GPT-5.4 sebelumnya sambil memberikan tingkat kecerdasan yang lebih tinggi.
Ini dicapai melalui desain bersama perangkat keras dan perangkat lunak yang mendalam. OpenAI menyajikan GPT-5.5 di sistem NVIDIA GB200 dan GB300 NVL72, memanfaatkan algoritma heuristik khusus yang ditulis oleh AI itu sendiri untuk membagi dan menyeimbangkan tugas di antara inti GPU.
Optimasi ini dikabarkan telah meningkatkan kecepatan penghasil token lebih dari 20%. Untuk pemikiran yang melibatkan alasan tingkat tinggi, mode “GPT-5.5 Thinking” dalam ChatGPT memberikan jawaban yang lebih cerdas dan ringkas dengan memberikan model waktu pemrosesan internal yang lebih lama untuk memverifikasi asumsi sebelum memberikan respons.
Kemampuan ini sangat terlihat dalam kinerja model pada “Expert-SWE,” sebuah benchmark internal OpenAI untuk tugas coding jangka panjang dengan waktu penyelesaian median manusia selama 20 jam. GPT-5.5 secara signifikan mengungguli GPT-5.4 di métrik ini sambil menggunakan token yang jauh lebih sedikit.
OpenAI kembali memimpin di pasar LLM yang paling kuat
Pasar untuk model-model frontier yang dibuat di AS telah menjadi perlombaan ketat antara OpenAI, Anthropic, dan Google.
Pekan lalu, Anthropic meluncurkan Opus 4.7, model terkuat yang tersedia untuk umum, yang mengambil alih posisi teratas berdasarkan jumlah pengujian benchmark pihak ketiga yang berhasil dilaluinya.
Namun hari ini, GPT-5.5 telah melampauinya dan bahkan model Claude Mythos Preview milik Anthropic yang lebih kuat dan dibatasi, meski hanya di satu benchmark, Terminal-Bench 2.0, yang menguji “kemampuan model untuk menavigasi dan menyelesaikan tugas di lingkungan terminal yang terkurung.”
GPT-5.5 mencapai akurasi 82,7% di Terminal-Bench 2.0, jauh mengungguli Opus 4.7 (69,4%) dan mengalahkan Mythos Preview (82,0%) dengan tipis.
Namun, dalam alasan multidisiplin tanpa alat, persaingan lebih ketat. Dalam Humanity’s Last Exam tanpa alat, GPT-5.5 Pro mencetak 43,1%, tertinggal dari Opus 4.7 (46,9%) dan Mythos Preview (56,8%).
Ini menunjukkan bahwa meskipun OpenAI menang dalam “penggunaan komputer” dan “agen,” model lain mungkin masih memiliki keunggulan dalam pengetahuan akademis tanpa alat.
Penting untuk dicatat bahwa Mythos Preview bukanlah produk yang tersedia secara umum; Anthropic mengklasifikasikannya sebagai aset defensif strategis karena risiko keamanan sibernya yang tinggi, membatasi aksesnya pada sekumpulan kecil mitra terpercaya dan lembaga pemerintah.
Karena Mythos tidak termasuk dalam penggunaan komersial yang luas, kompetisi pasar utama tetap antara GPT-5.5, Gemini 3.1 Pro, dan Claude Opus 4.7.
Ketika datang ke model yang dapat diakses oleh publik, GPT-5.5 kembali meraih mahkota bagi OpenAI, mencapai status tertinggi di 14 benchmark dibandingkan 4 untuk Claude Opus 4.7 dan 2 untuk Google Gemini 3.1 Pro.
GPT-5.5 mendominasi dalam penggunaan komputer yang otonom, pekerjaan pengetahuan ekonomi (GDPval), keamanan siber khusus (CyberGym), dan matematika kompleks (Frontier Math).
Sementara Claude Opus 4.7 memimpin dalam rekayasa perangkat lunak dan pemikiran tanpa alat, Gemini 3.1 Pro unggul dalam tiga kategori, khususnya dalam pemikiran akademis dan analisis keuangan.
Biaya meningkat untuk pengguna
Pergeseran dalam kecerdasan ini datang dengan peningkatan biaya yang signifikan untuk pengembang API, menurut informasi yang dibagikan OpenAI menjelang peluncuran publik model ini.
OpenAI telah menggandakan harga masuk untuk model flagship-nya dibandingkan generasi sebelumnya, dan lagi menggandakannya dari situ untuk varian model paling mutakhir, GPT-5.5 Pro:
|
Model |
Harga Input (per 1M token) |
Harga Output (per 1M token) |
|
GPT-5.4 |
$2,50 |
$15,00 |
|
GPT-5.5 |
$5,00 |
$30,00 |
|
GPT-5.5 Pro |
$30,00 |
$180,00 |
Untuk mengurangi biaya ini, OpenAI menekankan bahwa GPT-5.5 lebih “efisien token”, yang berarti menggunakan lebih sedikit token untuk menyelesaikan tugas yang sama dibandingkan GPT-5.4.
Bagi pengguna yang mengutamakan kecepatan dibandingkan kedalaman, OpenAI juga memperkenalkan mode Cepat di Codex, yang menghasilkan token 1,5 kali lebih cepat namun dengan biaya 2,5 kali lebih tinggi.
Tier “mini” dan “nano” yang ada di era GPT-5.4 (dihargai $0,75 dan $0,20 per 1M token input) saat ini tidak memiliki padanan GPT-5.5, meskipun perusahaan mencatat bahwa GPT-5.5 sedang diluncurkan untuk semua tier berlangganan, termasuk Plus, Pro, dan Enterprise.
Lisensi dan “perbatasan siber-permissif”
Pendekatan OpenAI terhadap keselamatan dan lisensi untuk GPT-5.5 memperkenalkan konsep baru: Akses Terpercaya untuk Siber. Karena model ini kini mampu mengidentifikasi dan menambal kerentanan keamanan yang canggih, OpenAI memberlakukan “klasifikasi risiko siber” yang lebih ketat untuk pengguna umum.
Bagi para profesional keamanan yang sah, OpenAI menawarkan lisensi “siber-permissif” khusus. Program ini memungkinkan pembela terverifikasi—yang bertanggung jawab atas infrastruktur kritis seperti jaringan listrik atau pasokan air—untuk menggunakan model seperti GPT-5.4-Cyber atau versi GPT-5.5 tanpa batasan yang lebih ketat terkait permintaan yang berkaitan dengan keamanan.
Kerangka kerja penggunaan ganda ini mengakui bahwa meskipun AI dapat mempercepat pertahanan siber, ia juga dapat digunakan sebagai senjata. Dalam Kerangka Kerja Persiapan OpenAI, GPT-5.5 diklasifikasikan sebagai “Risiko Tinggi” untuk kemampuan biologis dan keamanan siber.
Untuk mengelola ini, implementasi API saat ini memerlukan langkah-langkah pengamanan yang berbeda dibandingkan ChatGPT yang ditujukan untuk konsumer, dan OpenAI bekerja dengan mitra pemerintah untuk memastikan bahwa alat-alat ini digunakan untuk memperkuat—bukan melemahkan—ketahanan digital.
Reaksi awal: kehilangan akses terasa seperti “anggota tubuh diamputasi”
Umpan balik awal dari pengguna dan insinyur menunjukkan bahwa GPT-5.5 telah melewati ambang psikologis dalam hal utilitas AI. Bagi para pengembang, kemampuan model ini untuk mempertahankan “kejelasan konseptual” di seluruh kode besar adalah fitur uniknya.
“Ini adalah model coding pertama yang saya gunakan yang memiliki kejelasan konseptual yang serius,” kata Dan Shipper, CEO dari Every.
Shipper menguji model ini dengan meminta untuk mendebug kegagalan sistem yang kompleks yang sebelumnya memerlukan tim insinyur manusia untuk menulis ulang; GPT-5.5 secara otonom menghasilkan perbaikan yang sama. Demikian juga, Pietro Schirano, CEO dari MagicPath, menggambarkan “perubahan langkah” dalam kinerja ketika model ini berhasil menggabungkan sebuah cabang dengan ratusan perubahan refaktor menjadi cabang utama dalam satu kali proses selama 20 menit. Reaksi paling mendalam datang dari seorang insinyur anonim di NVIDIA yang mendapatkan akses awal ke model.
“Kehilangan akses ke GPT-5.5 terasa seperti saya kehilangan anggota tubuh,” katanya.
Sentimen ini juga tercermin di komunitas ilmiah. Derya Unutmaz, seorang profesor di Jackson Laboratory for Genomic Medicine, menggunakan GPT-5.5 Pro untuk menganalisis kumpulan data yang berisi 28,000 gen, menghasilkan laporan dalam waktu menit yang biasanya akan memakan waktu berbulan-bulan bagi timnya.
Brandon White, CEO dari Axiom Bio, bahkan menyatakan bahwa jika OpenAI melanjutkan kecepatan ini, “fondasi penemuan obat akan berubah pada akhir tahun ini.”
GPT-5.5 lebih dari sekadar pembaruan bertahap; ia adalah alat yang dirancang untuk dunia di mana manusia mendelegasikan seluruh alur kerja, bukan sekadar permintaan tunggal. Meski biayanya lebih tinggi dan pengamanan lebih ketat, peningkatan kinerja dalam pekerjaan otonom menunjukkan bahwa AI akhirnya bergerak dari kotak percakapan ke dalam sistem operasi.
Mungkin yang paling mengejutkan, para peneliti di perusahaan ini menyatakan bahwa masih ada ruang untuk melatih model-model yang jauh lebih pintar dari ini.
“Kami sebenarnya masih memiliki kapasitas untuk melatih model yang jauh lebih pintar dari ini,” kata Jakub Pachocki, ilmuwan kepala OpenAI.

