OpenAI Luncurkan GPT-5.5: Kinerja Lebih Unggul dari Claude Mythos Preview di Terminal-Bench 2.0!

Setelah berbulan-bulan rumor dan laporan bahwa OpenAI sedang mengembangkan model AI besar dengan kemampuan lebih kuat untuk digunakan di ChatGPT dan melalui antarmuka pemrograman aplikasi (API), yang diduga mempunyai nama kode “Spud”, perusahaan ini akhirnya mengungkap produk terbarunya dengan nama resmi GPT-5.5.

Table of Content

Fokus pada kinerja otonom
OpenAI kembali memimpin di pasar LLM yang paling kuat
Biaya meningkat untuk pengguna
Lisensi dan “perbatasan siber-permissif”
Reaksi awal: kehilangan akses terasa seperti “anggota tubuh diamputasi”

Tidak mengejutkan, GPT-5.5 kembali memimpin di antara model-model AI yang tersedia secara umum, melampaui pesaing seperti Anthropic dan Google, bahkan mengalahkan model pribadi dari Anthropic, yaitu Claude Mythos Preview, di satu metrik pengujian.

“Ini adalah model terkuat yang pernah kami buat untuk coding, baik dari segi standar pengujian maupun umpan balik yang kami terima dari mitra terpercaya,” jelas Amelia “Mia” Glaese, VP Riset di OpenAI, dalam panggilan video dengan wartawan sebelum peluncuran hari ini.

OpenAI memposisikan GPT-5.5 sebagai desain ulang fundamental tentang bagaimana kecerdasan berinteraksi dengan sistem operasi komputer dan tumpukan perangkat lunak profesional.

“Yang membuat model ini khusus adalah betapa banyaknya yang dapat dilakukannya dengan bimbingan yang lebih sedikit,” ungkap co-founder dan presiden OpenAI, Greg Brockman, dalam panggilan yang sama. “Model ini jauh lebih intuitif untuk digunakan. Ia dapat melihat masalah yang tidak jelas dan menentukan apa yang perlu dilakukan selanjutnya.”

Brockman juga menekankan area di mana pengguna bisa berharap mendapatkan keuntungan dari menggunakan GPT-5.5 dibandingkan model sebelumnya, GPT-5.4, yang masih tersedia (untuk saat ini) dengan biaya setengah dari API model baru ini.

“Model ini sangat baik dalam coding,” kata Brockman tentang GPT-5.5. “Ia juga hebat dalam pekerjaan komputer lebih luas, penggunaan komputer, dan penelitian ilmiah—aplikasi-aplikasi jenis ini yang seringkali menjadi hambatan kecerdasan.”

CEO dan co-founder OpenAI, Sam Altman, juga memberikan pandangannya tentang peluncuran ini di postingan di X, menulis, “Kami ingin pengguna kami memiliki akses ke teknologi terbaik dan setiap orang memiliki kesempatan yang sama.”

Model ini hadir dalam dua varian: GPT-5.5 dan GPT-5.5 Pro, di mana yang terakhir menawarkan presisi lebih serta logika khusus untuk menangani tuntutan kognitif yang paling ketat.

Sementara versi standar berfungsi sebagai flagship yang serbaguna untuk tugas-tugas kecerdasan umum, model Pro dirancang khusus untuk lingkungan berisiko tinggi seperti penelitian hukum, ilmu data, dan analisis bisnis tingkat lanjut di mana akurasi sangat penting. Tingkat premium ini memberikan respons yang lebih komprehensif dan terstruktur dengan baik, didukung oleh optimasi latensi khusus yang memastikan kinerja berkualitas tinggi selama alur kerja kompleks dan bertahap.

Sayangnya, akses API untuk GPT-5.5 dan GPT-5.5 Pro belum tersedia bagi pengembang perangkat lunak pihak ketiga dan akan segera hadir, menurut pengumuman OpenAI.

“Implementasi API memerlukan langkah-langkah pengamanan yang berbeda, dan kami bekerja sama dengan mitra dan pelanggan untuk memenuhi persyaratan keamanan dan keselamatan dalam penyajian ini secara berskala,” tulis OpenAI.

Saat ini, GPT-5.5 hanya tersedia bagi pelanggan yang membayar ChatGPT Plus ($20 per bulan), Pro ($100-$200 per bulan), serta pengguna bisnis dan enterprise, dengan akses GPT-5.5 Pro dimulai dari tingkat Pro dan lebih tinggi.

Fokus pada kinerja otonom

Di inti GPT-5.5 terdapat fokus pada kinerja “agen”—secara spesifik dalam coding, penggunaan komputer, dan penelitian ilmiah.

Berbeda dengan pendahulunya yang sering memerlukan permintaan langkah-demi-langkah untuk menghindari “halusinasi”, GPT-5.5 dirancang untuk menangani tugas-tugas rumit secara mandiri.

Model ini unggul dalam penelitian daring, debugging kode kompleks, dan berpindah antar dokumen dan spreadsheet tanpa intervensi manusia.

Salah satu lompatan teknis paling signifikan adalah efisiensinya. Meskipun model yang lebih besar biasanya mengalami latensi yang meningkat, GPT-5.5 dapat menyamai kecepatan latensi per token dari model GPT-5.4 sebelumnya sambil memberikan tingkat kecerdasan yang lebih tinggi.

Ini dicapai melalui desain bersama perangkat keras dan perangkat lunak yang mendalam. OpenAI menyajikan GPT-5.5 di sistem NVIDIA GB200 dan GB300 NVL72, memanfaatkan algoritma heuristik khusus yang ditulis oleh AI itu sendiri untuk membagi dan menyeimbangkan tugas di antara inti GPU.

Optimasi ini dikabarkan telah meningkatkan kecepatan penghasil token lebih dari 20%. Untuk pemikiran yang melibatkan alasan tingkat tinggi, mode “GPT-5.5 Thinking” dalam ChatGPT memberikan jawaban yang lebih cerdas dan ringkas dengan memberikan model waktu pemrosesan internal yang lebih lama untuk memverifikasi asumsi sebelum memberikan respons.

Kemampuan ini sangat terlihat dalam kinerja model pada “Expert-SWE,” sebuah benchmark internal OpenAI untuk tugas coding jangka panjang dengan waktu penyelesaian median manusia selama 20 jam. GPT-5.5 secara signifikan mengungguli GPT-5.4 di métrik ini sambil menggunakan token yang jauh lebih sedikit.

OpenAI kembali memimpin di pasar LLM yang paling kuat

Pasar untuk model-model frontier yang dibuat di AS telah menjadi perlombaan ketat antara OpenAI, Anthropic, dan Google.

Pekan lalu, Anthropic meluncurkan Opus 4.7, model terkuat yang tersedia untuk umum, yang mengambil alih posisi teratas berdasarkan jumlah pengujian benchmark pihak ketiga yang berhasil dilaluinya.

Namun hari ini, GPT-5.5 telah melampauinya dan bahkan model Claude Mythos Preview milik Anthropic yang lebih kuat dan dibatasi, meski hanya di satu benchmark, Terminal-Bench 2.0, yang menguji “kemampuan model untuk menavigasi dan menyelesaikan tugas di lingkungan terminal yang terkurung.”

GPT-5.5 mencapai akurasi 82,7% di Terminal-Bench 2.0, jauh mengungguli Opus 4.7 (69,4%) dan mengalahkan Mythos Preview (82,0%) dengan tipis.

Namun, dalam alasan multidisiplin tanpa alat, persaingan lebih ketat. Dalam Humanity’s Last Exam tanpa alat, GPT-5.5 Pro mencetak 43,1%, tertinggal dari Opus 4.7 (46,9%) dan Mythos Preview (56,8%).

Ini menunjukkan bahwa meskipun OpenAI menang dalam “penggunaan komputer” dan “agen,” model lain mungkin masih memiliki keunggulan dalam pengetahuan akademis tanpa alat.

Penting untuk dicatat bahwa Mythos Preview bukanlah produk yang tersedia secara umum; Anthropic mengklasifikasikannya sebagai aset defensif strategis karena risiko keamanan sibernya yang tinggi, membatasi aksesnya pada sekumpulan kecil mitra terpercaya dan lembaga pemerintah.

Karena Mythos tidak termasuk dalam penggunaan komersial yang luas, kompetisi pasar utama tetap antara GPT-5.5, Gemini 3.1 Pro, dan Claude Opus 4.7.

Ketika datang ke model yang dapat diakses oleh publik, GPT-5.5 kembali meraih mahkota bagi OpenAI, mencapai status tertinggi di 14 benchmark dibandingkan 4 untuk Claude Opus 4.7 dan 2 untuk Google Gemini 3.1 Pro.

GPT-5.5 mendominasi dalam penggunaan komputer yang otonom, pekerjaan pengetahuan ekonomi (GDPval), keamanan siber khusus (CyberGym), dan matematika kompleks (Frontier Math).

Sementara Claude Opus 4.7 memimpin dalam rekayasa perangkat lunak dan pemikiran tanpa alat, Gemini 3.1 Pro unggul dalam tiga kategori, khususnya dalam pemikiran akademis dan analisis keuangan.

Biaya meningkat untuk pengguna

Pergeseran dalam kecerdasan ini datang dengan peningkatan biaya yang signifikan untuk pengembang API, menurut informasi yang dibagikan OpenAI menjelang peluncuran publik model ini.

OpenAI telah menggandakan harga masuk untuk model flagship-nya dibandingkan generasi sebelumnya, dan lagi menggandakannya dari situ untuk varian model paling mutakhir, GPT-5.5 Pro:

Model	Harga Input (per 1M token)	Harga Output (per 1M token)
GPT-5.4	$2,50	$15,00
GPT-5.5	$5,00	$30,00
GPT-5.5 Pro	$30,00	$180,00

Untuk mengurangi biaya ini, OpenAI menekankan bahwa GPT-5.5 lebih “efisien token”, yang berarti menggunakan lebih sedikit token untuk menyelesaikan tugas yang sama dibandingkan GPT-5.4.

Bagi pengguna yang mengutamakan kecepatan dibandingkan kedalaman, OpenAI juga memperkenalkan mode Cepat di Codex, yang menghasilkan token 1,5 kali lebih cepat namun dengan biaya 2,5 kali lebih tinggi.

Tier “mini” dan “nano” yang ada di era GPT-5.4 (dihargai $0,75 dan $0,20 per 1M token input) saat ini tidak memiliki padanan GPT-5.5, meskipun perusahaan mencatat bahwa GPT-5.5 sedang diluncurkan untuk semua tier berlangganan, termasuk Plus, Pro, dan Enterprise.

Lisensi dan “perbatasan siber-permissif”

Pendekatan OpenAI terhadap keselamatan dan lisensi untuk GPT-5.5 memperkenalkan konsep baru: Akses Terpercaya untuk Siber. Karena model ini kini mampu mengidentifikasi dan menambal kerentanan keamanan yang canggih, OpenAI memberlakukan “klasifikasi risiko siber” yang lebih ketat untuk pengguna umum.

Bagi para profesional keamanan yang sah, OpenAI menawarkan lisensi “siber-permissif” khusus. Program ini memungkinkan pembela terverifikasi—yang bertanggung jawab atas infrastruktur kritis seperti jaringan listrik atau pasokan air—untuk menggunakan model seperti GPT-5.4-Cyber atau versi GPT-5.5 tanpa batasan yang lebih ketat terkait permintaan yang berkaitan dengan keamanan.

Kerangka kerja penggunaan ganda ini mengakui bahwa meskipun AI dapat mempercepat pertahanan siber, ia juga dapat digunakan sebagai senjata. Dalam Kerangka Kerja Persiapan OpenAI, GPT-5.5 diklasifikasikan sebagai “Risiko Tinggi” untuk kemampuan biologis dan keamanan siber.

Untuk mengelola ini, implementasi API saat ini memerlukan langkah-langkah pengamanan yang berbeda dibandingkan ChatGPT yang ditujukan untuk konsumer, dan OpenAI bekerja dengan mitra pemerintah untuk memastikan bahwa alat-alat ini digunakan untuk memperkuat—bukan melemahkan—ketahanan digital.

Reaksi awal: kehilangan akses terasa seperti “anggota tubuh diamputasi”

Umpan balik awal dari pengguna dan insinyur menunjukkan bahwa GPT-5.5 telah melewati ambang psikologis dalam hal utilitas AI. Bagi para pengembang, kemampuan model ini untuk mempertahankan “kejelasan konseptual” di seluruh kode besar adalah fitur uniknya.

“Ini adalah model coding pertama yang saya gunakan yang memiliki kejelasan konseptual yang serius,” kata Dan Shipper, CEO dari Every.

Shipper menguji model ini dengan meminta untuk mendebug kegagalan sistem yang kompleks yang sebelumnya memerlukan tim insinyur manusia untuk menulis ulang; GPT-5.5 secara otonom menghasilkan perbaikan yang sama. Demikian juga, Pietro Schirano, CEO dari MagicPath, menggambarkan “perubahan langkah” dalam kinerja ketika model ini berhasil menggabungkan sebuah cabang dengan ratusan perubahan refaktor menjadi cabang utama dalam satu kali proses selama 20 menit. Reaksi paling mendalam datang dari seorang insinyur anonim di NVIDIA yang mendapatkan akses awal ke model.

“Kehilangan akses ke GPT-5.5 terasa seperti saya kehilangan anggota tubuh,” katanya.

Sentimen ini juga tercermin di komunitas ilmiah. Derya Unutmaz, seorang profesor di Jackson Laboratory for Genomic Medicine, menggunakan GPT-5.5 Pro untuk menganalisis kumpulan data yang berisi 28,000 gen, menghasilkan laporan dalam waktu menit yang biasanya akan memakan waktu berbulan-bulan bagi timnya.

Brandon White, CEO dari Axiom Bio, bahkan menyatakan bahwa jika OpenAI melanjutkan kecepatan ini, “fondasi penemuan obat akan berubah pada akhir tahun ini.”

GPT-5.5 lebih dari sekadar pembaruan bertahap; ia adalah alat yang dirancang untuk dunia di mana manusia mendelegasikan seluruh alur kerja, bukan sekadar permintaan tunggal. Meski biayanya lebih tinggi dan pengamanan lebih ketat, peningkatan kinerja dalam pekerjaan otonom menunjukkan bahwa AI akhirnya bergerak dari kotak percakapan ke dalam sistem operasi.

Mungkin yang paling mengejutkan, para peneliti di perusahaan ini menyatakan bahwa masih ada ruang untuk melatih model-model yang jauh lebih pintar dari ini.

“Kami sebenarnya masih memiliki kapasitas untuk melatih model yang jauh lebih pintar dari ini,” kata Jakub Pachocki, ilmuwan kepala OpenAI.

Artikel Populer

Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

OpenAI Luncurkan GPT-5.5: Kinerja Lebih Unggul dari Claude Mythos Preview di Terminal-Bench 2.0!

Fokus pada kinerja otonom

OpenAI kembali memimpin di pasar LLM yang paling kuat

Biaya meningkat untuk pengguna

Lisensi dan “perbatasan siber-permissif”

Reaksi awal: kehilangan akses terasa seperti “anggota tubuh diamputasi”

Don't Miss

Kepala Google, termasuk Demis Hassabis, bantah tudingan ketidakmerataan adopsi AI di internal perusahaan

Dukung Inovasi AI: Kisah Sukses Pabrikan Model Open Source Kecil, Arcee!

Sektor Manufaktur ASEAN Kesulitan Mengadopsi AI, Bukan Karena Kurangnya Kesadaran, Kata Para Panelis

Baca Juga

Dari Sampingan Menjadi 7 Angka dalam 12 Bulan dengan 4 Alat AI, Tanpa Keterampilan Teknologi!

Porsche Siapkan Cayenne Coupe All-Electric Sebagai Penambahan Terbaru di Lineup Mereka

Sentimen Bearish Masih Menghantui Meskipun Ada Lonjakan Singkat yang Menjanjikan

Aplikasi iPad Ini Bikin Anda Berharap Punya Lebih Banyak Waktu Luang!

Pengusaha Kini Dapat Akses 1.000+ Kursus Profesional Seumur Hidup Hanya dengan $19,97!

Mark Zuckerberg Hubungi Elon Musk untuk Tawarkan Bantuan Terkait DOGE

Bluesky Hadirkan Attie: Aplikasi AI untuk Membuat Feed Kustom Sesuai Selera!

Pixel 10a Tanpa Benjolan Kamera: Desain Sleek yang Memukau!

Personal

Tentang Kami