Hari ini, startup AI asal China, Z.ai (dulu bernama Zhipu AI), mengumumkan peluncuran GLM-5.2 secara langsung. Model bahasa besar (LLM) ini memiliki 753 miliar parameter dan didesain khusus untuk menguasai tugas coding dan rekayasa yang “loncat jauh”.
- IndexShare memanfaatkan satu indexer untuk setiap empat lapisan perhatian yang jarang
- Benchmark terdepan untuk model open-source, menyamai dan bahkan mengalahkan pemimpin proprietary di beberapa kategori
- Tersedia melalui Rencana Coding dan API
- Kecantikan Lisensi MIT yang Tidak Dimodifikasi untuk Penggunaan Perusahaan
- Sambutan Hangat di Kalangan Pengembang AI dan Pembangun Alat
Model ini bisa diakses sekarang juga di Hugging Face, API Z.ai, dan lebih dari 20 lingkungan coding pihak ketiga lainnya. GLM-5.2 juga memperkenalkan jendela konteks yang stabil hingga 1 juta token, lengkap dengan tier langganan untuk perusahaan yang mulai dari hanya $12.60 per bulan.
Berita baik bagi perusahaan yang peduli dengan biaya dan keamanan, Z.ai merilis bobot inti GLM-5.2 di bawah lisensi open-source MIT yang tidak terbatas. Ini memungkinkan perusahaan untuk mengunduh model secara gratis dari Hugging Face, menyesuaikan atau menyempurnakannya sesuai kebutuhan, dan menjalankannya secara lokal atau melalui mesin virtual dengan biaya komputasi dan listrik saja.
Ini menjadi pilihan yang semakin menarik bagi perusahaan, terutama mengingat model-model proprietary asal Amerika yang menghadapi masa depan regulasi yang tidak pasti. Baru-baru ini, ada arahan kontrol ekspor dari pemerintah Trump yang melarang warga asing menggunakan model Claude Fable 5 dari Anthropic, yang menjadikan perusahaan tersebut harus menangguhkan semua model yang bersangkutan.
Bagi para pengambil keputusan teknis di perusahaan, GLM-5.2 dari Z.ai memberikan cara yang sangat produktif untuk menjalankan AI tingkat terdepan secara lokal, melewati pembatasan geografis dan batasan komersial.
IndexShare memanfaatkan satu indexer untuk setiap empat lapisan perhatian yang jarang
Di balik layar, GLM-5.2 beroperasi dengan 753 miliar parameter dan memperkenalkan optimasi arsitektur besar bernama “IndexShare”.
Di model bahasa besar standar, merekalkulasi mekanisme perhatian di seluruh dokumen panjang sangat memakan biaya komputasi. IndexShare menyelesaikan masalah ini dengan menggunakan indexer yang sama pada setiap empat lapisan perhatian yang jarang.
Pada panjang konteks maksimal 1 juta token, inovasi ini mengurangi per-token compute FLOPs hingga 2.9 kali lipat. Model ini juga dilengkapi dengan lapisan Multi-Token Prediction (MTP) yang ditingkatkan untuk decoding spekulatif, yang meningkatkan panjang token yang diterima hingga 20% saat inferensi.
Yang menarik, Z.ai juga menerapkan “Mode Berpikir” yang fleksibel dan dapat dipilih. Pengguna bisa mengatur upaya penalaran model antara “Max”, yang dirancang untuk mendorong batas logika pemecahan masalah, atau “High”, yang menawarkan keseimbangan antara performa tinggi dan efisiensi token yang sensitif terhadap latensi.
Benchmark terdepan untuk model open-source, menyamai dan bahkan mengalahkan pemimpin proprietary di beberapa kategori
Di uji benchmark pihak ketiga yang diakui industri, GLM-5.2 menunjukkan performa di atas sebagian besar model flagship open-source, bahkan DeepSeek v4, dan mencetak skor yang mendekati atau bahkan lebih tinggi dari rival dengan bobot tertutup, seperti GPT-5.5 dari OpenAI dan Claude Opus 4.8 dari Anthropic.
Model ini terutama unggul dalam penggunaan alat yang agentik dan tugas rekayasa perangkat lunak jangka panjang:
- SWE-bench Pro: GLM-5.2 mencetak 62.1, jauh mengalahkan GPT-5.5 (58.6) dan pendahulunya GLM-5.1 (58.4).
- FrontierSWE (Dominance): Dirancang untuk menguji penyelesaian tugas jangka panjang, GLM-5.2 mencapai 74.4%, melampaui GPT-5.5 (72.6%) dan berakhir hampir seimbang dengan Claude Opus 4.8 (75.1%).
Model ini juga menunjukkan skor tinggi dalam evaluasi penggunaan alat dengan mencapai 77.0 di MCP-Atlas, lebih tinggi dari GPT-5.5 (75.3) dan hampir menyamai Claude Opus 4.8 (77.8).
Meskipun GLM-5.2 sedikit tertinggal dari Claude Opus 4.8 dan GPT-5.5 dalam skor Terminal-Bench 2.1 (81.0 vs 85.0 dan 84.0), model ini mengungguli Google’s Gemini 3.1 Pro (74.0). Di luar metrik coding tradisional, GLM-5.2 meraih tempat pertama yang mengesankan dalam benchmark tugas desain crowdsourced, Design Arena, dengan skor ELO 1360.
Tersedia melalui Rencana Coding dan API
Untuk mengoperasikan model ini, Z.ai meluncurkan Rencana Coding GLM, yang ditujukan langsung untuk alur kerja pengembang alih-alih antarmuka chat sederhana.
Rencana ini menawarkan dukungan out-of-the-box untuk alat dan coding harness agenik pihak ketiga, termasuk Claude Code, OpenClaw, Cline, Kilo Code, Crush, dan Factory, di antara lainnya. Tier harga Rencana Coding (dengan penagihan tahunan) sangat kompetitif:
- Lite: $12.60 per bulan ($151.20 per tahun mulai tahun kedua), ditujukan untuk iterasi ringan di repositori kecil.
- Pro: $50.40 per bulan untuk pengembangan sehari-hari di repositori menengah, menawarkan 5x alokasi penggunaan dari rencana Lite.
- Max: $112.00 per bulan untuk beban kerja berat, menawarkan 20x penggunaan Lite dan sumber daya khusus saat jam sibuk.
Bagi pengembang enterprise yang mengintegrasikan model mentah ke dalam aplikasi mereka sendiri, harga API Z.ai secara signifikan lebih rendah dibandingkan dengan pesaing Barat, namun tetap sejalan dengan tarif yang sama pada generasi GLM-5.1 sebelumnya.
Akses API GLM-5.2 dibanderol sebesar $1.40 per juta token input dan $4.40 per juta token output, menjadikannya model dengan harga menengah secara global.
Untuk lebih mengoptimalkan biaya pada beban kerja konteks lama, Z.ai menawarkan tarif input cached hanya $0.26 per juta token, dengan penawaran waktu terbatas untuk penyimpanan input cached gratis.
Perbedaan mencolok antara inovator bobot terbuka dan lab proprietary Barat tidak luput dari perhatian komunitas pengembang.
Di platform X, pengamat AI, Lisan al Gaib (@scaling01), berpendapat, “lab perbatasan benar-benar menipu Anda dalam hal harga API”.
Postingan tersebut menyoroti bahwa meskipun model open-source besar seperti GLM-5.2 yang memiliki 744 miliar parameter mengenakan biaya $4.40 per juta token output, model proprietary seperti Sonnet 4.6 dan Opus 4.8 dari Anthropic memungut biaya sangat tinggi, yakni $15.00 dan $25.00 untuk masing-masing, sedangkan GPT-5.5 dari OpenAI dikenakan biaya $30.00 untuk output.
Kecantikan Lisensi MIT yang Tidak Dimodifikasi untuk Penggunaan Perusahaan
Aspek yang paling mengganggu dari peluncuran GLM-5.2 adalah lisensinya. Z.ai merilis bobot model di bawah lisensi open-source MIT, menjadikannya sebagai sistem “Pure Open”.
Dokumentasi teknis perusahaan secara eksplisit mencatat bahwa lisensi ini menjamin “tanpa batasan wilayah” dan memungkinkan “akses teknis tanpa batas”.
Bagi para pemimpin teknologi perusahaan, lisensi MIT berarti perangkat lunak dapat digunakan, dimodifikasi, dan dipasarkan tanpa membayar royalti atau mengikuti kebijakan pengaturan penggunaan yang ketat yang umum pada lisensi berdua. Ini memungkinkan tim rekayasa untuk menampung AI tingkat terdepan di infrastruktur mereka sendiri, sepenuhnya menghilangkan ketergantungan pada vendor.
Sambutan Hangat di Kalangan Pengembang AI dan Pembangun Alat
Reaksi para pengembang terhadap peluncuran ini sangat positif.
Tim di balik Kilo Code menyatakan telah melakukan integrasi pada hari pertama, memposting di X: “GLM-5.2 berfungsi di Kilo Code pada hari pertama. Jendela konteks 1M dan mode Max sudah aktif. Arahkan konfigurasi Anda ke sana dan mulai!”.
Lingkungan coding open-source, Cline IDE, juga menyampaikan hal serupa di X, mencatat keuntungan ekonomi: “GLM-5.2 adalah model bobot terbuka pertama yang melampaui 80% di Terminal-Bench, dan mengalahkan semua model open lainnya. Ini juga mengalahkan Gemini, menjadikannya model tingkat perbatasan dengan biaya yang sangat rendah. Bobot terbuka kembali. Model ini mengubah permainan. Sudah tersedia di Cline sekarang!”.
Demikian pula, agen desktop open-source bersaing, Eigent AI, juga menguji kemampuan baru model dalam alur kerja agentik kompleks, dengan menyatakan di X: “melakukan tugas long-horizon yang nyata: riset 30 perusahaan di 6 sektor stack infrastruktur AI, mengatur dalam JSON, lalu membangun laporan HTML interaktif… di mana 5.2 unggul: -> rencana…”.

