Berita besar di dunia AI perusahaan muncul akhir pekan kemarin ketika startup AI asal Tiongkok, MiniMax, meluncurkan model bahasa besar yang sangat dinantikan, M3. Model ini menawarkan kinerja coding and agentic yang mumpuni dan dukungan multimodalitas asli dengan jendela konteks 1 juta token, semuanya dengan harga yang jauh lebih terjangkau dibandingkan model proprietary terkemuka. Subscription baru ini dimulai dari hanya $20 per bulan.
Para pemimpin perusahaan juga mengumumkan rencana untuk menyediakan model ini dengan lisensi open source yang mencakup “open weights”, memungkinkan pengguna untuk mengunduh dan menyesuaikan model ini secara gratis dalam 10 hari ke depan. Untuk saat ini, layanan ini dapat diakses melalui API MiniMax dengan harga diskon khusus yaitu $0,3 per 1 juta input token dan $1,20 per juta output token selama seminggu ke depan, yang jelas lebih murah dibandingkan raksasa teknologi asal AS seperti Google, OpenAI, dan Anthropic, meski juga menawarkan kinerja yang lebih baik dari model-model sebelumnya dalam beberapa pengujian.
Bahkan pada harga penuh $0,6/$2,40 per juta token, biaya MiniMax-M3 masih 8-20% dari biaya model proprietary terkemuka di AS.
Matrix tradisional yang mengatur pengembangan model bahasa besar sebelumnya menghadapkan para pengembang perangkat lunak pada pilihan yang kaku: mereka hanya bisa mengakses biaya tinggi dari kecerdasan tertutup di balik API yang ketat atau beralih ke model open yang lebih hemat namun sering kali tidak mampu dalam tugas perhitungan multi-langkah dan pemrosesan data yang besar. Namun, MiniMax-M3 mengubah secara mendasar paradigma ini.
Dengan menyatukan dua kemampuan canggih yang historis terpisah, M3 menghadirkan utilitas komprehensif yang sebelumnya terbatas pada ekosistem tertutup yang mahal, sekaligus mengurangi kebutuhan komputasi yang diperlukan untuk menjalankan pengembangan kompleks.
Ringkasan Harga API Model AI Frontier oleh VentureBeat
| Model | Input | Output | Total Biaya | Sumber |
| MiMo-V2.5 Flash | $0,10 | $0,30 | $0,40 | Xiaomi MiMo |
| deepseek-v4-flash | $0,14 | $0,28 | $0,42 | DeepSeek |
| MiniMax-M3 | $0,30 | $1,20 | $1,50 (dalam waktu terbatas) | MiniMax |
Teknik MiniMax Sparse Attention (MSA) Membantu Menjaga Biaya Model Rendah
Pada inti efisiensi model ini adalah pergeseran arsitektur dari jaringan Transformer klasik. Mekanisme perhatian standar berkembang secara kuadratik, yang berarti biaya komputasi dan finansial membengkak saat panjang input teks bertambah.
Untuk mengatasi “cacat bawaan” ini, tim teknik melakukan implementasi MiniMax Sparse Attention (MSA), yang merupakan cetak biru perhatian jarang yang bersih dan dapat diperluas.
Dalam visualisasi inovasi ini, bayangkan perhatian penuh tradisional bagaikan editor yang membaca seluruh perpustakaan setiap kali dia perlu memverifikasi satu kalimat. MSA bertindak sebagai petugas pengarsipan pintar, menggunakan fase pemfilteran awal untuk membagi matriks Key-Value (KV) menjadi blok-blok yang sangat presisi.
MSA beroperasi dengan pendekatan “KV outer gather Q”. Sistem ini memperlakukan blok KV sebagai loop luar, secara dinamis mengumpulkan hanya kueri tertentu yang membidik mereka. Karena setiap blok data dibaca hanya sekali dan akses memori tetap sepenuhnya berurutan, pemanfaatan perangkat keras meningkat pesat.
Dalam uji coba internal, MSA beroperasi lebih dari 4 kali lebih cepat dibandingkan solusi open-source alternatif seperti Flash-Sparse-Attention.
Saat mengelola panjang konteks maksimal 1 juta token, permintaan komputasi M3 per token turun menjadi hanya 1/20 dari model generasi sebelumnya, yang artinya ada percepatan hingga 9 kali saat tahap prefilling dan 15 kali saat decoding.
Alih-alih menggabungkan jaringan teks yang telah dilatih sebelumnya dengan model visi terpisah, MiniMax merancang M3 sebagai sistem multimodal yang asli dari “Langkah Pertama”.
Perusahaan ini merombak mesin pengolahan datanya untuk memadukan urutan teks, gambar, dan komponen visual yang saling terjalin secara alami, memperluas total korpus pra-pelatihan lebih dari 100 triliun token.
Penyelarasan data yang mendalam ini memungkinkan model untuk menerjemahkan geometri visual kompleks, seperti grafik pemrograman atau peta koordinat, menjadi kode struktural tanpa mengorbankan konteks. Pada pengujian standar, M3 menunjukkan efektivitas jalan rekayasa ini.
Model ini mencatat 59.0% pada SWE-Bench Pro, metrik agen otonom, menempatkannya lebih unggul dari model tertutup seperti GPT-5.5 dan Gemini 3.1 Pro.
Reaksi awal komunitas terhadap M3 sangat positif. Ekosistem pengembang langsung memberikan perhatian pada perilaku otonom jangka panjangnya dan profil biaya-ke-kinerja yang mengesankan.
Untuk pengguna akhir, implementasi utama adalah MiniMax Code, sebuah produk agen AI yang dirancang untuk memaksimalkan kemampuan multi-langkah M3.
MiniMax berkomitmen untuk merilis M3 dengan model lisensi open-weights yang akan diluncurkan dalam 10 hari ke depan di HuggingFace dan GitHub, membawa manfaat signifikan bagi manajer infrastruktur perusahaan.
Dengan semua inovasi ini, M3 tidak hanya mengguncang industri, tetapi juga menciptakan peluang baru untuk pengembangan perangkat lunak otonom dan infrastruktur agen. MiniMax M3 menyediakan nilai luar biasa bagi perusahaan yang ingin berinvestasi dalam teknologi AI yang efisien dan efektif.

