Finware
  • Beranda
  • Riwayat
  • Disimpan
  • Feed
  • Topik Pilihan
  • News
  • Market
  • Bisnis
  • Kripto
  • Tech
Pemberitahuan
FinwareFinware
  • News
  • Market
  • Bisnis
  • Kripto
  • Tech
Search
  • Quick Access
    • Beranda
    • Contact Us
    • Riwayat
    • Disimpan
    • Topik Pilihan
    • Feed
  • Categories
    • News
    • Market
    • Bisnis
    • Kripto
    • Tech

Artikel Populer

Jangan lewatkan artikel menarik lainnya
Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Reihan
19 April 2026
Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Dirga
27 Maret 2026
Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

Dirga
31 Maret 2026
© 2026 Finware Media. All Right Reserved.
Finware > Bisnis > Kimi K2.7-Code Pangkas Token Pemikiran 30% — Tapi Praktisi Mengklaim Patokan yang Digunakan Tidak Akurat
Bisnis

Kimi K2.7-Code Pangkas Token Pemikiran 30% — Tapi Praktisi Mengklaim Patokan yang Digunakan Tidak Akurat

Keenan
Terakhir diperbarui: 13 Juni 2026 2:39 PM
Oleh
Keenan
5 Menit Baca
Bagikan
Kimi K2.7-Code Pangkas Token Pemikiran 30% — Tapi Praktisi Mengklaim Patokan yang Digunakan Tidak Akurat
Bagikan

Table of Content
  • Apa itu Kimi K2.7-Code
  • Sikap lebih jujur, namun lemah karenanya
  • Apa artinya untuk perusahaan

Moonshot AI baru saja meluncurkan Kimi K2.7-Code minggu ini, yang merupakan pembaruan open-source untuk keluarga model pemrograman K2. Mereka mengklaim pembaruan ini menawarkan proses logika yang lebih efisien dan peningkatan kinerja dua digit.

K2.7-Code dibangun dengan arsitektur campuran ahli yang sama seperti pendahulunya, K2.6, dan dapat digunakan melalui API yang kompatibel dengan OpenAI. Ini sangat berguna bagi tim yang sudah menjalankan K2.6 di gateway produksi mereka.

Saat K2.6 diluncurkan pada bulan April, model ini langsung menduduki peringkat teratas di papan peringkat mingguan LLM OpenRouter. Peringkat ini berdasarkan keputusan pengaturan API oleh para pengembang, bukan sekadar skor dari benchmark yang dilaporkan sendiri.

Moonshot AI menyebutkan bahwa K2.7-Code mengatasi masalah yang mereka sebut “overthinking,” dengan mengurangi penggunaan token pemikiran sebesar 30% dibandingkan K2.6. Angka ini jelas berpengaruh langsung pada biaya inference bagi tim yang menjalankan alur kerja agentik. Namun, efektivitas peningkatan ini dalam benchmark independen masih menjadi pertanyaan yang diperdebatkan oleh para praktisi.

Apa itu Kimi K2.7-Code

K2.7-Code dirilis di bawah lisensi MIT yang dimodifikasi, dengan bobot yang tersedia di HuggingFace. Model ini dapat digunakan melalui vLLM atau SGLang, berjalan eksklusif dalam mode pemikiran dan tidak mendukung penyesuaian suhu — Moonshot AI mengatur suhu tetap di 1.0, artinya tim tidak bisa menyesuaikan determinisme output seperti yang mungkin dilakukan dengan model lain.

Perubahan utama dari K2.6 adalah cara model ini menghasilkan kode tingkat rendah. Sementara K2.6 menghasilkan implementasi dengan membungkus pustaka yang ada dan melalui kerangka kerja yang sudah mapan, K2.7-Code langsung menulis implementasi. Moonshot AI mengklaim ini menghasilkan generalisasi yang lebih dapat diandalkan di berbagai bahasa seperti Rust, Go, dan Python, serta jenis tugas yang mencakup pengembangan frontend, DevOps, hingga optimasi kinerja.

Read more  Model dunia Genie dari Google kini bisa mensimulasikan jalan nyata dengan fitur Street View.

Dalam hal performa benchmark, Moonshot AI melaporkan peningkatan kinerja sebesar 21.8% pada Kimi Code Bench v2, 11% pada Program Bench, dan 31.5% pada MLS Bench Lite. Ketiga benchmark ini adalah milik Moonshot AI. Namun, model ini belum disubmit pada DeepSWE, yang merupakan benchmark coding independen dengan spread poin 70 antar model — dibandingkan dengan spread 30 poin dari SWE-Bench Pro. Hal ini menjadikan DeepSWE sinyal yang lebih menyaring bagi tim yang mengonfigurasi sistem routing model.

Sikap lebih jujur, namun lemah karenanya

Namun, gambaran dari luar benchmark Moonshot lebih kompleks. Peneliti Elliot Arledge menguji K2.7-Code melawan K2.6 dan Claude Fable 5 di KernelBench-Hard, sebuah benchmark publik yang berfokus pada optimisasi kernel GPU, dan mempublikasikan catatan hasilnya di kernelbench.com.

“K2.7 lebih jujur, namun tidak lebih mampu,” tulis Arledge di X.

Dari lima dari enam masalah, K2.7-Code menghasilkan kernel Triton yang ditulis langsung, di mana K2.6 menggunakan pembungkus pustaka. Dua dari kernel tersebut gagal akibat bug dari model itu sendiri. Hasil kernel MoE menurun dari skor K2.6 sebesar 0.222 menjadi 0.157.

“Fable, sebagai referensi, berhasil di setiap kasus yang tidak benar-benar gagal,” tulis Arledge.

Sugumaran Balasubramaniyan, seorang pengembang yang membangun model-router untuk platform Hermes Agent menggunakan DeepSWE sebagai sinyal rujukannya, menjawab publik terhadap rilis K2.7-Code dan menantang Moonshot AI mengenai pilihan benchmark ini.

“Dengan hormat, setiap model pasti ‘meningkat’ dua digit di suite pengujian mandirinya,” tulis Balasubramaniyan di X.

Dia mencatat bahwa K2.6 memperoleh skor 24% di DeepSWE, setara dengan GPT-5.4-mini, dan mempertanyakan apakah Moonshot AI akan mengajukan K2.7-Code ke benchmark yang sama. Balasubramaniyan juga menyatakan bahwa dibutuhkan 13 kali peninjauan untuk mendapatkan data benchmark yang tepat untuk router miliknya, dan dia akan mengarahkan tugas pemrograman ke K2.7-Code jika angka independen tersebut dapat dipercaya.

Read more  Prediksi Harga Pi Network 2026–2032: Bisakah Pi Kembali Sentuh Rekor Tertinggi?

Apa artinya untuk perusahaan

Peningkatan efisiensi token ini dapat langsung dimanfaatkan. Tim yang menjalankan K2.6 di produksi dapat mengganti dengan K2.7-Code melalui API yang kompatibel dengan OpenAI dan diharapkan meraih pengurangan biaya inference untuk alur kerja agentik tanpa perlu mengubah arsitektur. Pengurangan 30% dalam penggunaan token pemikiran adalah angka dari Moonshot sendiri, tetapi jalur integrasi ini cukup rendah risiko untuk diuji dengan beban kerja masing-masing sebelum berkomitmen.

Pertanyaan praktis adalah apakah peningkatan efisiensi tersebut dapat dipertahankan dalam distribusi tugas tim. Menguji K2.7-Code dengan beban kerja masing-masing terlebih dahulu sebelum menyesuaikan bobot gateway adalah jalan yang minim risiko untuk mengetahuinya.

DITANDAI:breaking
Bagikan Artikel Ini
Facebook Whatsapp Whatsapp LinkedIn Telegram Threads Salin Tautan
Avatar photo
OlehKeenan
Artikel eksklusif dari Keenan Prawira seputar tren bisnis terbaru, pendanaan startup, dan aksi korporasi. Insight esensial untuk para pemimpin bisnis modern.
Artikel Sebelumnya Tim Berners-Lee: Data Adalah Aset Berharga yang Melebihi Umur Sistem Tim Berners-Lee: Data Adalah Aset Berharga yang Melebihi Umur Sistem
Artikel Berikutnya Ancaman Iran Terhadap Kabel Laut: Senjata Baru yang Lebih Mengerikan daripada Minyak? Ancaman Iran Terhadap Kabel Laut: Senjata Baru yang Lebih Mengerikan daripada Minyak?
- Advertisement -
Ad image

Don't Miss

Steve Jobs: Pentingnya Belajar Pemrograman untuk Mengasah Kemampuan Berpikir di Era Digital
Steve Jobs: Pentingnya Belajar Pemrograman untuk Mengasah Kemampuan Berpikir di Era Digital
Tech
Saham Indonesia Anjlok ke Titik Terendah dalam Lima Tahun, Rupiah Jatuh ke Rekor Terburuk
Saham Indonesia Anjlok ke Titik Terendah dalam Lima Tahun, Rupiah Jatuh ke Rekor Terburuk
Market
Tony Vitello, Kapten Tim Raksasa yang Tertekan, Berikan Respon Singkat Soal Kembalinya ke NCAA
Tony Vitello, Kapten Tim Raksasa yang Tertekan, Berikan Respon Singkat Soal Kembalinya ke NCAA
Bisnis
- Advertisement -
Ad image

Baca Juga

Jelajahi insight lain yang sejalan dengan artikel ini!
Solana Mendekati Puncak Pola Segitiga: Siap Meluncur dengan Lonjakan 10%?
Kripto

Solana Mendekati Puncak Pola Segitiga: Siap Meluncur dengan Lonjakan 10%?

Rangga
28 April 2026
Rusia Hadapi Tantangan Ekonomi, Sipil, dan Politik di Tengah Perang Ukraina
Bisnis

Rusia Hadapi Tantangan Ekonomi, Sipil, dan Politik di Tengah Perang Ukraina

Keenan
25 April 2026
Jelajahi 16 Tahun Microsoft Build: Momen Penting dan Pengumuman Kunci yang Mengubah Lanskap Teknologi
Tech

Jelajahi 16 Tahun Microsoft Build: Momen Penting dan Pengumuman Kunci yang Mengubah Lanskap Teknologi

Keenan
15 Juni 2026
NYT Rilis Petunjuk dan Jawaban Menarik untuk Jumat, 1 Mei (Permainan #789)
Tech

NYT Rilis Petunjuk dan Jawaban Menarik untuk Jumat, 1 Mei (Permainan #789)

Keenan
1 Mei 2026
ChatGPT Luncurkan Paket Pro seharga $100/bulan: Siap Bawa Pengalaman Lebih Optimal!
Bisnis

ChatGPT Luncurkan Paket Pro seharga $100/bulan: Siap Bawa Pengalaman Lebih Optimal!

Keenan
10 April 2026
Analisis: Waktu Terbaik untuk Beli Ethereum Ada di ‘Zona Mematikan’ Ini!
Kripto

Analisis: Waktu Terbaik untuk Beli Ethereum Ada di ‘Zona Mematikan’ Ini!

Rangga
24 Mei 2026
Kiat Eva Longoria untuk Entrepreneur yang Terjebak dalam Kebuntuan
Bisnis

Kiat Eva Longoria untuk Entrepreneur yang Terjebak dalam Kebuntuan

Keenan
8 April 2026
Anggota Legislatif Connecticut Setujui RUU Larangan Ponsel di Sekolah, Namun Kritikus Menilai Aturan Berbeda untuk Dewasa dan Siswa Kurang Menjadi Contoh Baik
Tech

Anggota Legislatif Connecticut Setujui RUU Larangan Ponsel di Sekolah, Namun Kritikus Menilai Aturan Berbeda untuk Dewasa dan Siswa Kurang Menjadi Contoh Baik

Keenan
2 Mei 2026
Tampilkan Lebih Banyak
- Advertisement -
Ad image
- Advertisement -
Ad image
Finware

Baca berita keuangan global real-time, insight market APAC, tren bisnis, dan crypto paling komprehensif. Curi start sebelum market bergerak.

  • Kanal:
  • Bisnis
  • Market
  • Tech
  • Kripto

Personal

  • Riwayat
  • Disimpan
  • Feed
  • Topik Pilihan

Tentang Kami

  • Beranda
  • Hubungi Kami

© 2026 Finware Media. All Right Reserved.

Welcome Back!

Sign in to your account

Nama Pengguna atau Alamat Email
Kata Sandi

Lupa kata sandi Anda?