MiniMax-M3 Meluncur, Dapatkan Performa Unggul di Benchmark dengan Biaya Hanya 5-10% dari GPT-5.5 dan Gemini 3.1 Pro

Berita besar di dunia AI perusahaan muncul akhir pekan kemarin ketika startup AI asal Tiongkok, MiniMax, meluncurkan model bahasa besar yang sangat dinantikan, M3. Model ini menawarkan kinerja coding and agentic yang mumpuni dan dukungan multimodalitas asli dengan jendela konteks 1 juta token, semuanya dengan harga yang jauh lebih terjangkau dibandingkan model proprietary terkemuka. Subscription baru ini dimulai dari hanya $20 per bulan.

Table of Content

Ringkasan Harga API Model AI Frontier oleh VentureBeat
Teknik MiniMax Sparse Attention (MSA) Membantu Menjaga Biaya Model Rendah

Para pemimpin perusahaan juga mengumumkan rencana untuk menyediakan model ini dengan lisensi open source yang mencakup “open weights”, memungkinkan pengguna untuk mengunduh dan menyesuaikan model ini secara gratis dalam 10 hari ke depan. Untuk saat ini, layanan ini dapat diakses melalui API MiniMax dengan harga diskon khusus yaitu $0,3 per 1 juta input token dan $1,20 per juta output token selama seminggu ke depan, yang jelas lebih murah dibandingkan raksasa teknologi asal AS seperti Google, OpenAI, dan Anthropic, meski juga menawarkan kinerja yang lebih baik dari model-model sebelumnya dalam beberapa pengujian.

Bahkan pada harga penuh $0,6/$2,40 per juta token, biaya MiniMax-M3 masih 8-20% dari biaya model proprietary terkemuka di AS.

Matrix tradisional yang mengatur pengembangan model bahasa besar sebelumnya menghadapkan para pengembang perangkat lunak pada pilihan yang kaku: mereka hanya bisa mengakses biaya tinggi dari kecerdasan tertutup di balik API yang ketat atau beralih ke model open yang lebih hemat namun sering kali tidak mampu dalam tugas perhitungan multi-langkah dan pemrosesan data yang besar. Namun, MiniMax-M3 mengubah secara mendasar paradigma ini.

Dengan menyatukan dua kemampuan canggih yang historis terpisah, M3 menghadirkan utilitas komprehensif yang sebelumnya terbatas pada ekosistem tertutup yang mahal, sekaligus mengurangi kebutuhan komputasi yang diperlukan untuk menjalankan pengembangan kompleks.

Ringkasan Harga API Model AI Frontier oleh VentureBeat

Model	Input	Output	Total Biaya	Sumber
MiMo-V2.5 Flash	$0,10	$0,30	$0,40	Xiaomi MiMo
deepseek-v4-flash	$0,14	$0,28	$0,42	DeepSeek
MiniMax-M3	$0,30	$1,20	$1,50 (dalam waktu terbatas)	MiniMax

Teknik MiniMax Sparse Attention (MSA) Membantu Menjaga Biaya Model Rendah

Pada inti efisiensi model ini adalah pergeseran arsitektur dari jaringan Transformer klasik. Mekanisme perhatian standar berkembang secara kuadratik, yang berarti biaya komputasi dan finansial membengkak saat panjang input teks bertambah.

Untuk mengatasi “cacat bawaan” ini, tim teknik melakukan implementasi MiniMax Sparse Attention (MSA), yang merupakan cetak biru perhatian jarang yang bersih dan dapat diperluas.

Dalam visualisasi inovasi ini, bayangkan perhatian penuh tradisional bagaikan editor yang membaca seluruh perpustakaan setiap kali dia perlu memverifikasi satu kalimat. MSA bertindak sebagai petugas pengarsipan pintar, menggunakan fase pemfilteran awal untuk membagi matriks Key-Value (KV) menjadi blok-blok yang sangat presisi.

MSA beroperasi dengan pendekatan “KV outer gather Q”. Sistem ini memperlakukan blok KV sebagai loop luar, secara dinamis mengumpulkan hanya kueri tertentu yang membidik mereka. Karena setiap blok data dibaca hanya sekali dan akses memori tetap sepenuhnya berurutan, pemanfaatan perangkat keras meningkat pesat.

Dalam uji coba internal, MSA beroperasi lebih dari 4 kali lebih cepat dibandingkan solusi open-source alternatif seperti Flash-Sparse-Attention.

Saat mengelola panjang konteks maksimal 1 juta token, permintaan komputasi M3 per token turun menjadi hanya 1/20 dari model generasi sebelumnya, yang artinya ada percepatan hingga 9 kali saat tahap prefilling dan 15 kali saat decoding.

Alih-alih menggabungkan jaringan teks yang telah dilatih sebelumnya dengan model visi terpisah, MiniMax merancang M3 sebagai sistem multimodal yang asli dari “Langkah Pertama”.

Perusahaan ini merombak mesin pengolahan datanya untuk memadukan urutan teks, gambar, dan komponen visual yang saling terjalin secara alami, memperluas total korpus pra-pelatihan lebih dari 100 triliun token.

Penyelarasan data yang mendalam ini memungkinkan model untuk menerjemahkan geometri visual kompleks, seperti grafik pemrograman atau peta koordinat, menjadi kode struktural tanpa mengorbankan konteks. Pada pengujian standar, M3 menunjukkan efektivitas jalan rekayasa ini.

Model ini mencatat 59.0% pada SWE-Bench Pro, metrik agen otonom, menempatkannya lebih unggul dari model tertutup seperti GPT-5.5 dan Gemini 3.1 Pro.

Reaksi awal komunitas terhadap M3 sangat positif. Ekosistem pengembang langsung memberikan perhatian pada perilaku otonom jangka panjangnya dan profil biaya-ke-kinerja yang mengesankan.

Untuk pengguna akhir, implementasi utama adalah MiniMax Code, sebuah produk agen AI yang dirancang untuk memaksimalkan kemampuan multi-langkah M3.

MiniMax berkomitmen untuk merilis M3 dengan model lisensi open-weights yang akan diluncurkan dalam 10 hari ke depan di HuggingFace dan GitHub, membawa manfaat signifikan bagi manajer infrastruktur perusahaan.

Dengan semua inovasi ini, M3 tidak hanya mengguncang industri, tetapi juga menciptakan peluang baru untuk pengembangan perangkat lunak otonom dan infrastruktur agen. MiniMax M3 menyediakan nilai luar biasa bagi perusahaan yang ingin berinvestasi dalam teknologi AI yang efisien dan efektif.

Artikel Populer

Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Oracle Satukan Data AI untuk Perusahaan Agensi Single Version of Truth

Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

MiniMax-M3 Meluncur, Dapatkan Performa Unggul di Benchmark dengan Biaya Hanya 5-10% dari GPT-5.5 dan Gemini 3.1 Pro

Ringkasan Harga API Model AI Frontier oleh VentureBeat

Teknik MiniMax Sparse Attention (MSA) Membantu Menjaga Biaya Model Rendah

Don't Miss

OpenAI Hadapi Permintaan Startup yang Melonjak di APAC Sambil Perkuat Tim di Singapura

Keberadaan Kraken di Inggris Ungkap Rumitnya Regulasi Kripto yang Tak Sekedar Lisensi Sederhana

Valve Tunjukkan Cara Membangun Layar E-Paper Sendiri untuk Steam Machine â€“ Modifikasi Kasus yang Tak Terduga dan Sangat Dibutuhkan!

Baca Juga

Peneliti Berhasil Latih Model Dasar dari Awal dengan Biaya Hanya $1.500

Tebak Wordle #1801: Petunjuk dan Jawaban untuk Senin, 25 Mei

Wikipedia Batasi Penggunaan AI dalam Penulisan Artikel

Weibo Hadirkan VibeThinker-3B, Memicu Perdebatan Baru di Dunia AI soal Standar Kinerja

Banyak Perusahaan Kirimkan Bug Lebih Cepat Daripada Solusi: Mitos Software Factory Terkuak!

Menemukan Ancaman Keamanan Sebelum Terlambat: Kunci untuk Perlindungan yang Efektif

Kerangka Memori Baru Pakai 118 Ribu Token per Query, LangMem Boros 3,26 Juta!

Inilah Sektor-sektor di Mana Pekerjaan Bertumbuh dan Menyusut di Ekonomi Saat Ini

Personal

Tentang Kami