Selama dua dekade terakhir, utang teknis berarti arsitektur yang ketinggalan zaman, kode yang berantakan, dan dokumentasi yang kurang terawat. Namun, definisi ini kini tidak lagi cukup di era AI, di mana mode kegagalan menjadi lebih halus dan sering kali non-linear. Sistem AI mulai menghadirkan lapisan-lapisan utang teknis baru yang tersebar di berbagai promosi, model, dan ketergantungan data. Lapisan-lapisan ini lebih sulit terlihat, lebih sulit diukur, dan sering lebih berbahaya dibandingkan dengan utang tradisional.
Krisis yang Tersembunyi di Depan Mata
Kompleksitas sistem AI dan kegagalan yang terkait dengannya sudah banyak didokumentasikan. Sebuah studi MIT yang dipublikasikan pada 2025 menemukan bahwa 95% proyek AI gagal untuk mencapai produksi atau memberikan nilai. Studi serupa dari S&P Global Market Intelligence melaporkan bahwa 42% bisnis membatalkan beberapa inisiatif AI pada tahun 2025—peningkatan tajam dari 17% pada tahun sebelumnya. Berbagai alasan dikemukakan untuk kegagalan ini, tetapi sebagian besar mengacu pada sistem yang dirancang dan diterapkan dengan buruk, yang sulit dikelola dan memiliki banyak titik kegagalan yang sulit dipantau, sehingga menyebabkan akumulasi utang AI yang cepat.
Utang teknis tradisional biasanya terlokalisasi pada basis kode, dan bug biasanya mudah direproduksi. Dengan demikian, bug dapat dengan mudah dikenali selama pengujian dan diperbaiki dengan merombak basis kode. Namun, utang AI lebih tersebar luas, muncul di berbagai promosi, model, jalur data, dan semua infrastruktur terkait. Selain itu, utang ini lebih bersifat sporadis: karena sifat probabilistik dari AI, sistem tidak selalu merespons dengan cara yang sama, mengakibatkan kegagalan yang tidak terduga. Hal ini membuatnya lebih menantang untuk mengidentifikasi risiko selama pengujian, dan juga menciptakan kebutuhan untuk pemantauan yang lebih terus menerus bahkan setelah penerapan untuk mencegah penyimpangan dan penurunan performa secara bertahap.
Bentuk Baru Utang AI
Utang AI biasanya muncul dalam empat bentuk baru, masing-masing dengan serangkaian risikonya sendiri.
Utang Promosi adalah yang paling terlihat dari semua. Versi modern dari ‘spaghetti code’, ini mencakup penyesuaian promosi yang tidak terdokumentasi, akumulasi ‘perbaikan cepat’ yang menyebabkan inkonsistensi, serta pengabaian kontrol versi promosi dan ‘stuffing promosi’ (memuat data atau konteks tambahan langsung ke dalam promosi AI). Semua ini menjadikan promosi sebagai bentuk kode yang tidak teruji dan tanpa kontrol versi, yang menyebabkan peningkatan kerapuhan dan kerentanan.
Utang Ketergantungan Model adalah bentuk utang AI yang semakin umum. Kebanyakan perusahaan saat ini bergantung pada campuran model eksternal yang dikembangkan oleh penyedia model dasar terkemuka; aplikasi dan agen dibangun di atas panggilan API ke model-model ini. Akibatnya, logika aplikasi sekarang bergantung pada model-model eksternal yang tidak dapat dikendalikan dengan jelas. Saat model diperbarui, performa bervariasi dan reproduktifitas hilang—promosi yang disesuaikan untuk satu model mungkin gagal atau berkinerja buruk saat beralih ke model lain, baik dari penyedia yang sama atau dari penyedia berbeda.
Kebanyakan penerapan AI perusahaan saat ini menggunakan retrieval-augmented generation (RAG), yang menarik konteks tambahan dari repositori data perusahaan. Utang Retrieval adalah akibat dari repositori ini yang memiliki data berantakan, dokumen duplikat, dan informasi yang kadaluarsa. Hal ini menyebabkan AI mengembalikan jawaban yang secara teknis benar tetapi tidak relevan lagi, menyebabkan kegagalan selanjutnya. Berbeda dengan halusinasi, ini lebih sulit terdeteksi karena jawaban tersebut mungkin benar hingga baru-baru ini dan terlihat benar bagi setiap penguji.
Utang Evaluasi mencerminkan kurangnya standarisasi dalam pengujian dan pemantauan untuk model dan aplikasi AI. Meskipun ada tolok ukur AI, mereka cenderung fokus pada tes yang sempit dan mencerminkan hasil pada titik waktu tertentu. Kebanyakan perusahaan kurang memiliki standar pengujian yang konsisten, dataset kebenaran dasar, dan pemantauan real-time untuk penerapan; belum ada padanan untuk continuous integration/continuous delivery (CI/CD) untuk promosi. Sebagai akibatnya, CIO dan CTO tidak memiliki visibilitas yang jelas tentang performa model dan tidak dapat melacak perbaikan atau penurunan model.
Semua ini ditambah dengan bentuk-bentuk utang teknis tradisional yang masih muncul di alat dan sistem yang berinteraksi dengan aplikasi dan agen AI, baik yang dibaca atau ditulis. Peningkatan cepat dalam adopsi kode yang dihasilkan AI (sering kali diterapkan tanpa pengujian yang memadai) semakin memperburuk inkonsistensi di dalam dan pemeliharaan basis kode tradisional.
Bentuk-bentuk baru dari utang AI ini bergabung dengan bentuk-bentuk utang teknis sebelumnya untuk memperburuk dan menciptakan risiko berskala besar yang dapat menyebabkan kegagalan katastropik dari seluruh penerapan perusahaan. Memecahkan risiko ini semakin sulit karena sifat kepemilikan AI yang terdistribusi—kebanyakan sistem mencakup tim teknik, produk, data, dan bisnis, yang mengakibatkan ketidakjelasan tanggung jawab ketika terjadi kesalahan.
Akibatnya, risiko-risiko ini muncul dalam bentuk meningkatnya biaya komputasi, ketidakakuratan dalam keluaran AI, dan meningkatnya pengecualian yang perlu ditangani oleh manusia—yang menyebabkan proyek sering terhenti dan gagal akibat kisah pengembalian investasi yang tidak jelas dan kurangnya kepercayaan dari pengguna.
Bagaimana Perusahaan Dapat Mencegah Utang AI
Utang AI tidak akan terpecahkan hanya dengan ‘model yang lebih baik’—angka kegagalan tetap tinggi meskipun model sudah memiliki akurasi yang tinggi. Solusi untuk utang AI memerlukan desain sistem yang lebih baik, integrasi, kontrol, dan perubahan budaya organisasi.
Pertama, promosi perlu diperlakukan sebagai kode. Ini melibatkan kontrol versi yang hati-hati, dokumentasi, dan pengujian yang ketat baik sebelum maupun setelah penerapan untuk semua konfigurasi promosi yang mungkin. Praktik terbaik dari dunia coding tradisional—seperti menggunakan blok promosi yang lebih kecil daripada dinding promosi yang besar, atau mengurangi penggunaan parameter yang dikodekan secara keras—juga dapat membantu mengurangi utang AI.
Kedua, evaluasi perlu dibangun ke dalam seluruh tumpukan infrastruktur AI. Pipeline evaluasi yang berkelanjutan perlu didirikan dan harus mencerminkan berbagai metrik yang mengukur baik metrik teknis maupun yang selaras dengan bisnis. Selain itu, sistem observabilitas AI harus diintegrasikan untuk memantau kualitas output, tingkat kegagalan, penyimpangan model, dan penyimpangan data.
Ketiga, keterjelasan harus disertakan sebagai default di semua hasil AI untuk mengatasi keterbatasan reproduktifitas. Jejak data, model yang digunakan, dan langkah-langkah yang diikuti harus bisa dilacak dengan jelas untuk memungkinkan audit hasil dan koreksi jika terjadi kesalahan sistemik.
Ini memerlukan program pengurangan utang AI yang eksplisit dan anggaran terkait, serupa dengan gelombang investasi sebelumnya dalam keamanan atau modernisasi cloud. Hal ini perlu didorong di tingkat CXO oleh pemimpin kunci untuk mencegah pekerjaan ulang yang mahal di kemudian hari.
Kesimpulan: Satu Jahitan di Waktu
Penerapan AI di perusahaan bukan hanya sekedar kode statis; mereka adalah sistem hidup yang berinteraksi dengan seluruh tumpukan perusahaan. Oleh karena itu, tantangan utama dalam perusahaan yang bersifat agensial bukanlah membangun atau menerapkan sistem cerdas, tetapi mempertahankan sistem ini untuk memastikan keandalan terus-menerus saat beroperasi di dunia nyata.
Perusahaan yang berusaha untuk proaktif mengidentifikasi dan mengurangi utang AI sejak fase desain adalah yang paling mungkin membangun platform AI yang berkelanjutan dan memberikan peningkatan produktivitas signifikan dalam jangka panjang di seluruh organisasi.

