Whale di dunia AI kembali mencuat.
DeepSeek, startup AI asal China yang merupakan cabang dari High-Flyer Capital Management, menjadi sensasi global di awal Januari 2025 setelah merilis model open source R1 yang mampu bersaing dengan raksasa AS.
Sejak saat itu, era AI telah berkembang pesat. Meski DeepSeek sudah mengeluarkan beberapa pembaruan model dan produk V3, komunitas internasional di bidang AI dan bisnis menanti-nanti kelanjutan momen R1 ini.
Kini saatnya datang dengan peluncuran DeepSeek-V4 yang dirilis semalam. Model ini memiliki 1,6 triliun parameter dan menggunakan desain Mixture-of-Experts (MoE) yang bisa diakses secara gratis di bawah lisensi open source MIT. Yang menarik, performanya mendekati, bahkan di beberapa tolok ukur melampaui, sistem tertutup paling maju di dunia dengan biaya hanya sekitar 1/6 dari harga API mereka.
Pembebasan ini—yang dijelaskan oleh peneliti DeepSeek, Deli Chen, sebagai “hasil kerja keras” 484 hari setelah peluncuran V3—disambut sebagai “momen kedua DeepSeek.” Seperti yang Chen sebutkan dalam unggahan di X, “AGI adalah milik semua.” Model ini kini tersedia di komunitas berbagi kode AI Hugging Face dan melalui API DeepSeek.
AI Kelas Frontier dengan Biaya yang Lebih Rendah
Dampak paling langsung dari peluncuran DeepSeek-V4 adalah ekonomis. Tabel harga yang telah disesuaikan menunjukkan bahwa meski DeepSeek tidak menetapkan harga Pro model terbarunya di level mendekati nol, mereka tetap mendorong akses ke model high-end dengan biaya yang jauh lebih rendah dibandingkan model-model frontier dari AS.
DeepSeek-V4-Pro dipasarkan melalui API dengan harga $1.74 USD per 1 juta token input pada cache miss dan $3.48 per juta token output.
Dengan perbandingan satu juta input dan satu juta output, total biaya menjadi $5.22. Jika menggunakan cache, harga input menurun menjadi $0.145 per juta token, sehingga total menjadi $3.625.
Ini jauh lebih murah dibandingkan harga premium dari OpenAI dan Anthropic. Untuk referensi, GPT-5.5 dibanderol dengan $5.00 per juta token input dan $30.00 per juta token output, menjadikannya total $35.00. Sementara itu, Claude Opus 4.7 dihargai $5.00 untuk input dan $25.00 untuk output, total $30.00.
|
Model |
Input |
Output |
Total Biaya |
Sumber |
|
DeepSeek-V4-Pro |
$1.74 |
$3.48 |
$5.22 |
DeepSeek |
Dalam hal harga dasar, DeepSeek-V4-Pro hadir dengan biaya sekitar sepersepuluh harga GPT-5.5 dan seperdelapan harga Claude Opus 4.7.
Model DeepSeek-V4-Flash, bukan Pro, menawarkan harga yang lebih ekstrem dengan $0.14 per juta token input pada cache miss dan $0.28 per juta token output, sehingga totalnya menjadi $0.42.
Penggunaan cache membuat harganya turun lebih jauh ke $0.308, jauh di bawah harga GPT-5.5 dan Claude Opus 4.7 — ini sekitar 1/100 dari biaya, meskipun dengan penurunan performa yang signifikan.
DeepSeek sedang memperkecil biaya model canggih ke dalam rentang yang jauh lebih rendah, memaksa pengembang dan perusahaan untuk mempertimbangkan kembali perhitungan biaya-manfaat di seputar model premium yang tertutup.
Benchmark: DeepSeek-V4-Pro Mendekati, Namun Masih Di Bawah GPT-5.5 dan Opus 4.7
DeepSeek-V4-Pro-Max lebih baik dipahami bukan sebagai kekalahan bersih dari sistem frontier tertutup terbaru, tetapi sebagai lompatan terbuka yang signifikan. Klaim benchmark terkuat dari model ini datang dari tabel perbandingan DeepSeek sendiri, di mana model ini menunjukkan performa yang lebih baik dari GPT-5.4 xHigh, Claude Opus 4.6 Max, dan Gemini 3.1 Pro High di beberapa tes, seperti Codeforces dan Apex Shortlist.
Namun, saat dibandingkan dengan model-model tertutup terbaru seperti GPT-5.5 atau Claude Opus 4.7, gambaran ini lebih terbatas. Di beberapa kategori, GPT-5.5 dan Claude Opus 4.7 masih memimpin.
DeepSeek-V4-Pro-Max menunjukkan performa terbaik di BrowseComp, dengan angka 83.4% yang hampir menyamai GPT-5.5 di 84.4% dan lebih baik dari Claude Opus 4.7 di 79.3%.
Di Terminal-Bench 2.0, DeepSeek mendapat 67.9%, mendekati Claude Opus 4.7 di 69.4%, namun jauh di bawah GPT-5.5 yang mencapai 82.7%.
Secara keseluruhan, meski DeepSeek-V4-Pro-Max belum berhasil mengalahkan GPT-5.5 atau Claude Opus 4.7 di setiap tolok ukur, hasilnya cukup dekat di banyak tes. Dengan harga API yang jauh lebih rendah, ini menjadi sorotan utama.
Dalam praktiknya, DeepSeek tidak perlu menang di setiap peringkat untuk tetap relevan. Jika mereka bisa memberikan performa mendekati frontier di banyak tugas yang relevan dengan bisnis dengan biaya kira-kira satu per enam hingga satu per tujuh dari standar API, ini tetap memaksa pemikiran ulang besar tentang ekonomi penerapan AI canggih.
Inovasi Arsitektur yang Mengubah Permainan
Kemampuan DeepSeek untuk menawarkan harga dan performa ini berakar pada inovasi arsitektur radikal yang dijelaskan dalam laporan teknisnya yang juga dirilis hari ini. Capaian teknis paling menonjol dari V4 adalah kemampuan konteks satu juta token sebagai jendela native. Biasanya, mempertahankan konteks sebesar itu memerlukan memori yang sangat besar.
DeepSeek mengatasi ini dengan memperkenalkan Arsitektur Hybrid Attention yang menggabungkan Compressed Sparse Attention (CSA) untuk mengurangi dimensi token awal dan Heavily Compressed Attention (HCA) untuk secara agresif mengompresi jejak memori.
Memang, model V4-Pro ini hanya membutuhkan 10% dari cache KV serta 27% dari FLOPs inferensi single-token dibandingkan pendahulunya, DeepSeek-V3.2, walaupun beroperasi pada konteks 1 juta token.
Berbagai hasil benchmark menunjukkan bahwa DeepSeek-V4-Pro-Max adalah model open-weight terkuat saat ini, dan mendekati sistem tertutup frontier di beberapa benchmark praktis.
Walaupun GPT-5.5 dan Claude Opus 4.7 masih memimpin di sebagian besar perbandingan langsung pada tabel benchmark yang dipublikasikan, DeepSeek V4 Pro nyaris setara sambil menawarkan biaya yang jauh lebih murah.
Reaksi komunitas terhadap peluncuran DeepSeek-V4 adalah kejutan dan validasi. Hugging Face secara resmi menyambut “whale” kembali, menandakan bahwa era konteks satu juta yang terjangkau telah tiba.
DeepSeek-V4 lebih dari sekadar model baru; ini adalah tantangan terhadap status quo. Dengan membuktikan bahwa inovasi arsitektur dapat menggantikan maksimalisme komputasi, DeepSeek memberikan akses kepada komunitas pengembang global terhadap kecerdasan AI tingkat tinggi dengan biaya yang jauh lebih rendah.

