Meta dan raksasa teknologi lainnya mengaitkan PHK terbaru dengan narasi yang sama: AI bisa melakukan pekerjaan itu sekarang, jadi manusia tidak diperlukan. Memang benar, kita sudah melihat AI mendekati tingkat keahlian manusia dengan cepat. Namun, selama satu dekade kami mengembangkan alat AI yang menawarkan persiapan wawancara yang disesuaikan, kami juga menyaksikan mengapa merancang sistem yang hanya mengandalkan AI adalah taruhan yang keliru.
Di atas kertas, AI terlihat telah mencapai performa setara manusia. Microsoft baru-baru ini menggunakan model canggih OpenAI untuk “menyelesaikan” lebih dari delapan dari sepuluh studi kasus tes di New England Journal of Medicine, sementara tingkat keberhasilan dokter manusia hanya sekitar 20 persen.
Sementara itu, lembaga penelitian non-profit METR memprediksi bahwa pada tahun 2030, AI dapat “menjalankan proyek perangkat lunak yang kompleks” yang saat ini memerlukan waktu minggu atau bahkan bulan kerja ahli manusia. Namun, penggantian kami tidaklah sebersih yang diyakini industri AI.
Perusahaan yang saat ini memilih menerapkan AI hanya untuk menghemat biaya akan segera menemukan kenyataan yang mahal: sistem AI yang paling efektif adalah yang dirancang di sekitar keahlian manusia, bukan mengesampingkannya. Mengintegrasikan validasi manusia secara permanen dan sengaja ke dalam alur kerja AI adalah kunci untuk membuka setiap level fungsi AI yang selanjutnya.
Ketika Sistem AI Gagal
Peningkatan akurasi AI masih sulit dicapai. Setiap peningkatan 10 persen dalam model dasar membutuhkan pengeluaran sebesar $1 triliun. Pada saat yang sama, peneliti Stanford telah menemukan bahwa model bahasa besar mungkin tidak akan mampu secara andal membedakan antara yang benar dan yang diyakini manusia sebagai benar.
Artinya, tanpa penilaian manusia dalam sistem, AI akan dengan percaya diri memperbesar kekurangan. Namun, ada titik kegagalan yang tetap ada bahkan jika AI sempurna: seringkali, sistem yang mengandung AI tidak menggunakannya dengan benar.
Contohnya, seorang pemimpin manajemen produk menugaskan seorang agen untuk membangun dasbor kinerja mingguan secara mandiri. Semua terlihat baik-baik saja, jadi produk dikirim dengan pengawasan yang minimal. Beberapa bulan kemudian, manajemen mengalihkan pengeluaran iklan ke produk baru berdasarkan grafik tersebut. Penjualan kuartal berikutnya merosot. Penyebabnya: agen tersebut secara diam-diam menghitung pengguna percobaan gratis sebagai pelanggan yang membayar, yang bisa dengan cepat ditemukan oleh seorang ahli manusia. Akibatnya, anggaran iklan selama satu kuartal terbuang sia-sia karena peran pengawasan manusia tidak didefinisikan dengan benar.
Atau perusahaan yang menggunakan AI untuk keputusan perekrutan. Tanpa masukan manusia untuk menyesuaikan pilihannya, model tersebut menjadi terjebak dalam asumsi yang ketinggalan zaman mengenai seperti apa pemimpin yang sukses. Hal ini mengabaikan banyak kandidat yang secara teknis kurang memenuhi syarat tetapi membawa kombinasi keterampilan yang tepat; orang-orang yang seorang manajer berpengalaman akan secara instinktif pilih dari tumpukan. Di sini, aturan pengalihan yang lebih terstruktur untuk setiap aplikasi bisa menjaga kandidat ini tetap terjaga.
Ini bukan skenario khayalan. Kami menyaksikan ini berlangsung dalam pekerjaan kami dengan sistem AI; dari bagaimana mereka masih mencakup pedoman medis yang cepat berubah atau bagaimana mereka salah menganggap bisa melampaui langkah pengawasan manusia.
Konsekuensinya terus bertambah seiring perusahaan berlomba-lomba mengintegrasikan AI ke dalam proses inti mereka dan konsumen semakin mengabaikan konsultasi ahli untuk nasihat dari AI. Selama masa henti kode, seorang agen AI untuk Replit menghapus seluruh basis data secara langsung tanpa ulasan manusia, dan pengenalan wajah yang didorong AI mengirim seorang wanita di Tennessee ke penjara selama lima bulan untuk kejahatan yang tidak dilakukannya di North Dakota.
Insiden-insiden ini adalah biaya yang dapat diprediksi akibat gagal mengintegrasikan manusia dengan benar dan justru menganggap mereka sebagai efisiensi yang harus dioptimalisasi.
Membangun Alur Kerja Native AI
Para pemimpin perusahaan mendorong tim untuk “menambahkan sedikit AI” pada alur kerja yang ada untuk meningkatkannya. Namun, hanya menambahkan AI justru memperburuk masalah mendasar seiring proses berkembang. Untuk membangun AI yang mewujudkan janji pertumbuhannya, kita harus mendesain ulang alur kerja agar secara inheren memanfaatkan kekuatan AI, manusia, dan perangkat lunak.
Kenyataannya, tidak setiap tugas memerlukan model bahasa besar; ada situasi yang memerlukan prediktabilitas dalam pengalihan, validasi, dan batasan. Jika semuanya probabilistik, alur kerja menjadi lebih menyerupai mesin saran daripada sistem yang andal.
Sistem AI terbaik menggabungkan proses yang kaku dan fleksibel serta dengan jelas mendefinisikan kepemilikan tugas di tiga lapisan terpisah:
1. Fleksibilitas AI: menyematkan model probabilistik yang menginterpretasikan permintaan yang lebih abstrak dan mengubahnya menjadi tindakan yang dikenali.
2. Perangkat Lunak Deterministik: menambahkan aturan pengalihan kaku, batasan, pemicu validasi, dan pengecualian yang mengarahkan operasi ke jalur yang benar. Ini dapat mencakup lapisan RAG yang sadar konteks yang menarik dari “basis pengetahuan” yang telah ditentukan sebelumnya sambil juga mengendalikan memori dan kompresi.
3. Manusia untuk Konteks: terus-menerus menilai asumsi model, mengubah alur kerja berdasarkan kondisi eksternal, memperjelas nuansa perilaku manusia atau ketidakpastian secara keseluruhan, dan membuat keputusan akhir.
Fleksibilitas AI mengidentifikasi masukan yang tidak sesuai dengan harapan sistem, sementara lapisan deterministik membantu memberi batasan pada tugas yang tidak mampu dilakukan, alih-alih menenangkan pengguna.
Di tingkat fungsionalitas ideal ini, AI bisa membuat rekomendasi untuk langkah selanjutnya tetapi membiarkan manusia memilih jalur yang akan diambil.
Mendefinisikan Ulang Human-In-The-Loop
Memang, AI sering kali tidak akurat, tetapi hal itu tidak menghilangkan potensinya. Seringkali, itu adalah sistem yang cacat di sekitar AI yang menyebabkan keruntuhan yang paling berbahaya.
Untuk meningkatkan integrasi AI, tujuannya adalah melampaui sekadar menambahkan “manusia dalam lingkaran.” Jika manusia hanya hadir untuk memeriksa output akhir AI, alur kerja itu cacat. Sebaliknya, kita harus merancang sistem AI di mana setiap bagian memberikan kontribusi terbaik untuk hasil yang dapat diandalkan.
Menghilangkan manusia dari proses yang didorong AI saat ini sama dengan menukar aset yang menguntungkan dengan kemenangan sekali pakai. Alih-alih, memusatkan dan dengan jelas mendefinisikan peran keahlian manusia adalah apa yang akan membuat sistem AI lebih baik seiring waktu.
Perusahaan yang mendominasi dekade mendatang bukanlah yang memiliki struktur organisasi terkecil, tetapi mereka yang berhasil mengintegrasikan manusia dengan perangkat lunak untuk mendorong kemajuan AI.

