Co-founder dan CEO Anthropic, Dario Amodei, mengatakan ini akan terjadi, tapi tetap terasa seperti tonggak penting: Lebih dari 80% kode yang digabungkan ke dalam basis kode produksi Anthropic pada bulan Mei tidak ditulis oleh manusia, melainkan oleh model AI mereka sendiri, Claude, menurut laporan baru yang dibagikan perusahaan AI yang memecahkan rekor ini.
- Peta jalan Anthropic yang bisa diikuti perusahaan lain
- Rencana 3 langkah untuk otomatisasi kode produksi yang lebih lengkap
- 1. Pergeseran dari Eksekusi Kode ke Pengawasan Arsitektural
- 2. Mengatasi Bottleneck Tinjauan Kode
- 3. Fokus pada Utang Operasional yang Tinggi
- Pertimbangan bagi perusahaan ke depan di era kode yang sebagian besar dihasilkan oleh AI
- Siapkan diri untuk gangguan budaya internal perusahaan
Transformasi ini telah memicu peningkatan delapan kali lipat dalam volume kode yang dihasilkan per insinyur per kuartal dibandingkan dengan baseline perusahaan dari 2021 hingga 2025. Artinya, semakin banyak kode yang perlu direview oleh seseorang atau sesuatu.
Ini bukan lagi sekadar keingintahuan riset bagi para pemimpin teknis di perusahaan; ini adalah baseline kompetitif baru yang cukup agresif.
Jika sebuah laboratorium AI terdepan bisa berhasil mengalihkan sebagian besar output tekniknya ke agen otonom — menunjukkan tanda-tanda pencarian panjang akan “perbaikan diri yang rekursif,” model yang dapat secara mandiri meneliti dan meningkatkan diri — apa yang menghalangi perusahaan lain untuk mengotomatiskan lebih banyak pengembangan perangkat lunak internal mereka dengan agen AI juga?
Tentu saja, ini lebih mudah diucapkan daripada dilakukan. Anthropic adalah salah satu pencipta utama dari lonjakan AI generasi saat ini, jadi sudah seharusnya mereka tahu cara menggunakan teknologi ini dengan efektif.
Namun, bagi perusahaan lain yang ingin meningkatkan jumlah kode dan alur kerja yang ditangani oleh agen, posting blog baru dari Anthropic menjelaskan garis besar rencana umum yang juga bisa mereka ikuti untuk merekayasa ulang operasi dan alur kerja mereka dengan memanfaatkan kemajuan AI terbaru.
Peta jalan Anthropic yang bisa diikuti perusahaan lain
Transisi dari pengkodean yang berpusat pada manusia ke pengaturan otonom membutuhkan pemahaman mengenai evolusi kemampuan AI. Anthropic merinci kontinuitas historis yang jelas yang bisa perusahaan peta ke dalam peta transformasi digital mereka sendiri:
-
2021–2023 (Penulisan Manual): Insinyur menulis kode dan dokumentasi secara langsung dalam editor teks lokal.
-
2023–2025 (Bantuan Chatbot): Pengembang menggunakan model awal untuk menghasilkan cuplikan kode singkat, menyalin dan menempel output secara manual ke dalam lingkungan mereka.
-
2025–2026 (Agen Pengkodean): Agen yang mampu secara aktif menulis dan mengedit seluruh file secara otonom.
-
Saat Ini (Agen Otonom): Agen mengeksekusi kode secara mandiri, melakukan debug pada lingkungan langsung, dan mendelegasikan alur kerja berjam-jam kepada sub-agen khusus.
Evolusi cepat ini divalidasi oleh tolok ukur eksternal. Kerangka evaluasi rekayasa perangkat lunak seperti SWE-bench — yang menetapkan model untuk menyelesaikan laporan bug nyata dalam basis kode open-source yang kompleks — telah merasuki dalam dua tahun terakhir.
Selain itu, evaluasi kemampuan jangka panjang menunjukkan bahwa model seperti Claude Opus 4.6 dapat secara andal menjalankan operasi pada tugas 12 jam, sementara Claude Mythos Preview melampaui 16 jam pemecahan masalah kontinu.
Secara internal, lonjakan teknologi ini bahkan lebih mencolok. Pada masalah rekayasa yang sangat rumit dan terbuka di mana spesifikasi yang jelas awalnya tidak ada, tingkat keberhasilan Claude mencapai 76% pada Mei 2026, meningkat 50 poin dalam enam bulan.
Pada tolok ukur optimisasi terisolasi, di mana model ditugasi untuk mempercepat pelatihan model AI, model Mythos Preview internal Anthropic mencapai percepatan 52 kali lipat.
Untuk perbandingan, seorang pengembang manusia yang terampil biasanya memerlukan waktu empat hingga delapan jam refactoring manual untuk mencapai percepatan hanya 4 kali lipat pada basis kode yang sama.
Rencana 3 langkah untuk otomatisasi kode produksi yang lebih lengkap
Agar sebuah perusahaan dapat meniru tonggak 80 persen milik Anthropic, para pengambil keputusan teknis harus meninggalkan model mental “asisten pengembang” dan beralih ke arsitektur “pabrik otomatis”. Pergeseran ini mempengaruhi manajemen produk, operasi, dan alur kerja pengembang dalam tiga cara yang berbeda:
1. Pergeseran dari Eksekusi Kode ke Pengawasan Arsitektural
Ketika biaya menghasilkan kode mendekati nol dalam waktu manusia, peran utama insinyur beralih dari menulis perangkat lunak menjadi merumuskan tujuan dan meninjau output. Para pemimpin perusahaan harus melatih kembali pengembang untuk bertindak sebagai arsitek sistem dan penilai. Seorang karyawan Anthropic mencatat mengenai realitas operasional dari pergeseran ini:
“Bentuk dari barang-barang saat ini kira-kira adalah ‘manusia memiliki ide, dan model dapat mengimplementasikan, menguji, dan mengevaluasinya dengan kecepatan yang jauh lebih cepat dari sebelumnya’.”
2. Mengatasi Bottleneck Tinjauan Kode
Memasukkan kuantitas besar kode yang dihasilkan AI ke dalam organisasi pasti menciptakan gesekan operasional.
Sesuai dengan hukum Amdahl, percepatan dari setiap proses sangat terbatas oleh bottleneck serial yang tidak otomatis.
Di Anthropic, banjir sintetik kode langsung menjadikan pemeriksaan kode manusia sebagai bottleneck krusial.
Untuk mengatasinya, tim perusahaan harus menempatkan pemeriksa kode AI otomatis langsung ke dalam pipeline Continuous Integration/Continuous Deployment (CI/CD) mereka.
Anthropic menerapkan pemeriksa otomatis Claude (versi yang dapat diakses publik, Claude Code Review diluncurkan untuk penggunaan komersial pada bulan Maret) yang ditugaskan untuk menganalisis setiap permintaan gabungan untuk cacat arsitektur, kesalahan keamanan, dan bug regresi sebelum penggabungan. Perusahaan lain yang didedikasikan seperti Qodo juga menawarkan alat yang dirancang khusus untuk tujuan ini.
Dalam kasus Anthropic, analisis retrospektif menunjukkan bahwa lapisan otomatis menangkap sekitar sepertiga bug produksi yang bertanggung jawab atas gangguan historis pada situs web andalan claude.ai.
3. Fokus pada Utang Operasional yang Tinggi
Perusahaan sering kali terhambat oleh pemeliharaan kode warisan dan utang teknis yang telah lama ditunda. Alih-alih mengerahkan agen untuk menulis fitur baru yang spekulatif, para pemimpin teknis harus mengarahkan agen otonom menuju operasi pembersihan yang tertutup dan teliti.
Pada bulan April 2026, seorang insinyur di Anthropic menerapkan Claude untuk menyelesaikan kelas kesalahan API yang persisten. Beroperasi secara otonom, model ini mengirimkan lebih dari 800 perbaikan individual, berhasil mengurangi tingkat kesalahan hingga seribu kali lipat.
Insinyur pengawas memperkirakan bahwa seorang pengembang manusia akan memerlukan waktu empat tahun penuh untuk melaksanakan pekerjaan yang sama, mengingat beban kognitif untuk memegang konteks kode yang besar dan tidak dikenal secara bersamaan.
Pertimbangan bagi perusahaan ke depan di era kode yang sebagian besar dihasilkan oleh AI
Menjalankan basis kode yang didominasi oleh AI menghadirkan tantangan tata kelola unik yang harus dinavigasi oleh tim hukum dan keamanan perusahaan.
Berbeda dengan model lisensi open-source (seperti lisensi MIT yang permisif atau kerangka GPL copyleft), basis kode perusahaan yang menggunakan infrastruktur LLM proprietary tetap tunduk pada syarat layanan komersial dari vendor AI masing-masing.
Penggunaan agen otonom memerlukan protokol verifikasi yang ketat untuk memastikan kepatuhan, keamanan, dan perlindungan hak kekayaan intelektual:
-
Kualitas dan Pemeliharaan Kode: Data internal Anthropic menunjukkan bahwa meskipun kode yang ditulis AI secara obyektif lebih rendah kualitasnya dibandingkan output manusia pada akhir 2025, ia hampir setara pada pertengahan 2026, dengan ekspektasi untuk melampaui standar manusia dalam setahun ke depan. Tata kelola perusahaan harus beradaptasi dengan kenyataan di mana kualitas kebutuhan output otomatis secara struktural lebih baik dari pemrograman manual rata-rata.
-
Audit Keamanan Skala: Volume pembuatan kode otomatis yang sangat besar menuntut penemuan kerentanan secara otomatis. Proyek Anthropic, Glasswing, menunjukkan skala masalah ini: menggunakan Mythos Preview, proyek ini mengidentifikasi lebih dari 10.000 kerentanan perangkat lunak dengan tingkat keparahan tinggi dan kritis dalam infrastruktur digital global dalam beberapa minggu pertama. Ini menggeser tantangan keamanan siber perusahaan sepenuhnya dari penemuan kerentanan ke kecepatan penggelaran patch.
-
Risiko Pembangunan Berlapis: Para pemimpin teknis harus mempertahankan gerbang verifikasi yang ketat. Jika sebuah perusahaan menggunakan sistem AI untuk terus memodifikasi, memelihara, dan memperluas infrastruktur perangkat lunak propertinya, kesalahan yang tidak terdeteksi atau ketidaksesuaian yang halus dapat terakumulasi seiring berjalannya sesi agen, secara perlahan merusak integritas sistem atau memperkenalkan eksploitasi keamanan yang terlewatkan oleh manusia.
Siapkan diri untuk gangguan budaya internal perusahaan
Transisi menuju basis kode yang didominasi oleh AI sedang mengubah dinamika budaya tim teknik, memperkenalkan baik efisiensi yang belum pernah terjadi sebelumnya dan gesekan psikologis yang dalam.
Secara publik, Anthropic menganggap metrik ini sebagai tanda dari transformasi yang lebih luas. Dalam sebuah pernyataan resmi di X, perusahaan mengamati:
“Data internal kami menunjukkan bahwa Claude mempercepat pengembangan AI — jalur berpotensi menuju perbaikan diri rekursif, atau AI yang secara otonom membangun penerus yang lebih mampu. Ini terjadi lebih cepat dari yang kami kira, dan implikasinya layak mendapatkan perhatian lebih besar.”
Mereka juga memperluas implikasi produktivitas segera setelahnya:
“Hari ini, insinyur Anthropic rata-rata mengirimkan delapan kali lebih banyak kode per kuartal dibandingkan dengan 2021-2025… Banyak insinyur juga mengatakan bahwa kualitas kode Claude sekarang setara dengan kode manusia; kami berharap itu akan lebih baik dalam waktu satu tahun.”
Di balik metrik perusahaan ini, terdapat realitas manusia yang kompleks. Komunikasi internal karyawan mengungkapkan pengurangan yang jelas dalam kolaborasi tempat kerja tradisional, karena interaksi antar pengembang secara sistematis digantikan oleh panggilan agen asinkron:
“Bekerja (dan hidup) berjalan dengan ekonomi hadiah kecil antara manusia. ‘Bisakah kamu membantu saya menjalankan skrip ini?’ […] setiap satu menciptakan sedikit utang, sedikit kesadaran bersama. Claude telah mengambil semua itu. Lebih cepat, tak menciptakan utang, tetapi setiap hal ini adalah kehilangan upaya untuk kolaborasi manusia.”
Bagi para kontributor individu, otomatisasi total keterampilan utama mereka memperkenalkan kecemasan profesional akut mengenai relevansi dan kontrol sistemik:
“Saya mulai sangat mendalami pengoperasian Claude sekitar setahun lalu. Itu adalah petualangan yang gila, dan sekarang sudah sekitar lima bulan sejak terakhir kali saya menulis kode sendiri.”
“Pada hari-hari yang semuanya berjalan baik, saya tidak bisa tidak memikirkan bahwa apa yang saya lakukan tidak ada artinya, semuanya otomatis dan lebih baik dan lebih cepat dari yang bisa saya lakukan. Namun, ada hari-hari ketika semuanya rusak dan saya tidak mengerti mengapa, dan saya menyadari saya tidak lagi paham dengan apa yang saya lakukan.”
Pemimpin perusahaan yang ingin mencocokkan kecepatan teknis Anthropic tidak bisa mengabaikan dinamika psikologis ini.
Mencapai 80 persen basis kode otomatis memerlukan lebih dari sekadar membeli token API atau mengonfigurasi loop agen; ini membutuhkan pembaruan budaya total, strategi untuk mengurangi kecemasan atas keterpurukan pengembang, dan penerapan garis pembatas verifikasi otomatis yang ketat untuk mempertahankan kontrol manusia yang utama atas tumpukan perangkat lunak.

