Finware
  • Beranda
  • Riwayat
  • Disimpan
  • Feed
  • Topik Pilihan
  • News
  • Market
  • Bisnis
  • Kripto
  • Tech
Pemberitahuan
FinwareFinware
  • News
  • Market
  • Bisnis
  • Kripto
  • Tech
Search
  • Quick Access
    • Beranda
    • Contact Us
    • Riwayat
    • Disimpan
    • Topik Pilihan
    • Feed
  • Categories
    • News
    • Market
    • Bisnis
    • Kripto
    • Tech

Artikel Populer

Jangan lewatkan artikel menarik lainnya
Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Indonesia Terancam Tertinggal dalam Euforia EV, Sebagian Besar Nikel Dialihkan ke Baja Tahan Karat, Temuan Riset Mengungkap

Reihan
19 April 2026
Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Aksi Saham Terbesar Siang Ini: META, BBY, APP, SMG Siap Mengguncang Pasar!

Dirga
27 Maret 2026
Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

Warren Buffett Akui Terlambat Jual Saham Apple: Siap Tambah, Tapi Tunggu Pasar Lebih Baik!

Dirga
31 Maret 2026
© 2026 Finware Media. All Right Reserved.
Finware > Bisnis > LangSmith Engine Otomatisasi Proses Debugging Agen—Namun, Perusahaan Multi-Model Masih Butuh Lapisan Netral
Bisnis

LangSmith Engine Otomatisasi Proses Debugging Agen—Namun, Perusahaan Multi-Model Masih Butuh Lapisan Netral

Keenan
Terakhir diperbarui: 19 Mei 2026 10:36 PM
Oleh
Keenan
5 Menit Baca
Bagikan
LangSmith Engine Otomatisasi Proses Debugging Agen—Namun, Perusahaan Multi-Model Masih Butuh Lapisan Netral
Bagikan

Perusahaan yang sedang membangun dan menerapkan agen menghadapi tantangan: waktu yang dibutuhkan insinyur untuk mendeteksi kesalahan yang dibuat oleh agen terlalu lama, dan masalah ini terus berulang, terutama tanpa adanya keterlibatan manusia di setiap langkah.

Table of Content
  • LangSmith Engine Menganalisis Kegagalan
  • Penyedia Model Menghadirkan Evaluator dalam Platform

LangSmith, platform pemantauan dan evaluasi yang dikembangkan oleh LangChain, meluncurkan fitur baru dalam fase beta publik yang bisa membantu mengatasi permasalahan ini. LangSmith Engine secara otomatis mendeteksi kegagalan produksi, mendiagnosa penyebab utama berdasarkan kode yang sedang berjalan, menyusun perbaikan, dan mencegah regresi dalam satu proses otomatis.

LangSmith Engine memberikan jalan yang lebih cepat bagi insinyur AI untuk melakukan triase, namun peluncurannya memasuki arena yang sudah cukup ramai: Anthropic, OpenAI, dan Google juga mengintegrasikan observabilitas dan evaluasi ke dalam platform mereka sendiri.

LangSmith Engine Menganalisis Kegagalan

Dalam sebuah postingan blog, LangChain menjelaskan bahwa siklus pengembangan agen biasanya dimulai dengan melacak agen untuk memahami fungsinya, dilanjutkan dengan mengidentifikasi kekurangan, melakukan perubahan pada prompt dan alat, serta membuat dataset akurat. Para pengembang kemudian menjalankan eksperimen dan memeriksa regresi sebelum meluncurkan agen tersebut.

Permasalahannya, seringkali pelanggan menghadapi kendala ketika ulasan jejak tidak mendeteksi pola yang salah, pengulangan kesalahan sulit terbaca, dan tidak ada evaluator yang secara spesifik menangkap masalah yang sama saat itu muncul kembali di produksi.

LangSmith Engine bekerja dengan memantau jejak produksi untuk beberapa jenis sinyal, seperti “kesalahan eksplisit, gagal evaluasi online, anomali jejak, umpan balik negatif pengguna, dan perilaku tidak biasa seperti pengguna yang bertanya hal-hal yang tidak dapat dijawab oleh agen,” menurut artikel tersebut.

Read more  Flick Berambisi Pimpin Barcelona Kembali, Tetap Jadi Pelatih Terbaik untuk Tugas Ini

Engine kemudian akan membaca kode yang sedang berjalan, mencari penyebab masalah dan menyusun permintaan tarik (pull request) sebelum mengusulkan evaluator khusus untuk pola kesalahan tersebut. Keterlibatan manusia baru terjadi pada tahap persetujuan.

Fitur ini dibangun di atas infrastruktur pemantauan dan evaluasi LangSmith yang ada, dan juga bekerja dengan hasil evaluator dari perusahaan.

Berbeda dengan alat observabilitas seperti Weights & Biases, Arize Phoenix, dan Honeyhive, LangSmith Engine mengambil seluruh rantai secara otomatis — mulai dari mendeteksi kegagalan, mendiagnosa penyebab utama, hingga menyusun perbaikan — dan hanya melibatkan manusia pada langkah persetujuan.

Penyedia Model Menghadirkan Evaluator dalam Platform

Sementara LangSmith mengidentifikasi siklus evaluasi ini sebagai kebutuhan bagi banyak perusahaan, Engine hadir di saat penyedia lebih besar mulai menawarkan alat observabilitas di dalam platform mereka. Ini berarti perusahaan mungkin memilih untuk menggunakan platform end-to-end alih-alih menambahkan LangSmith Engine ke konfigurasi kerja yang sudah ada.

Claude Managed Agents dari Anthropic menggabungkan penyebaran agen, evaluasi, dan orkestrasi dalam satu suite. Frontier dari OpenAI menawarkan platform serupa untuk membangun, mengelola, dan mengevaluasi agen perusahaan — meskipun keduanya menghadapi tantangan dari perusahaan yang khawatir untuk berkomitmen pada satu vendor saja.

Namun, para praktisi menunjukkan bahwa tidak semua orang ingin membawa evaluasi dan observabilitas sepenuhnya ke dalam satu platform.

Leigh Coney, pendiri dan konsultan utama di Workwise Solutions, mengatakan kepada VentureBeat bahwa observabilitas pihak ketiga adalah default untuk banyak perusahaan.

“Salah satu dana yang saya kerjakan menjalankan Claude untuk analisis dan GPT untuk alur kerja yang terpisah. Jika observabilitas ada dalam alat masing-masing penyedia, maka kini ada dua sistem yang tidak dapat berkomunikasi satu sama lain. Tim kepatuhan Anda tidak dapat menghasilkan jejak audit yang terintegrasi,” ujarnya. “Jadi observabilitas pihak ketiga masih bertahan karena multi-model sudah menjadi default di perusahaan, dan seseorang harus menjembatani antara penyedia.”

Read more  SpaceX Siap Luncurkan GPU Sendiri, Tapi Takkan Bersaing dengan Kartu GeForce Nvidia

Jessica Arredondo Murphy, CEO dan salah satu pendiri True Fit, menambahkan bahwa platform independen seperti LangSmith harus membuktikan kepada perusahaan bahwa mereka bisa “menjawab pertanyaan jangka panjang tentang apakah mereka dapat menjadi lapisan operasional antar-model untuk kualitas dan keandalan.”

“Perusahaan tidak mengkonsolidasikan ke dalam alat penyedia model pertama secepat yang diinginkan oleh penyedia model. Yang saya lihat adalah pembagian pragmatis: tim akan menggunakan alat penyedia pertama untuk onboarding cepat dan debugging tahap awal, tetapi segera setelah mereka peduli tentang keandalan produksi, tata kelola, dan fleksibilitas jangka panjang, mereka cenderung memperkenalkan lapisan yang lebih netral untuk observabilitas dan evaluasi,” jelasnya.

LangSmith Engine saat ini sudah tersedia dalam beta publik. Tim dapat menghubungkan proyek pelacakan mereka, secara opsional menyambungkan repositori, dan Engine akan mulai memunculkan masalah dari jejak produksi secara otomatis.

DITANDAI:featured
Bagikan Artikel Ini
Facebook Whatsapp Whatsapp LinkedIn Telegram Threads Salin Tautan
Avatar photo
OlehKeenan
Artikel eksklusif dari Keenan Prawira seputar tren bisnis terbaru, pendanaan startup, dan aksi korporasi. Insight esensial untuk para pemimpin bisnis modern.
Artikel Sebelumnya Google I/O 2026: Pembaruan Gemini, Android XR, dan Inovasi Menarik di Showcase Perangkat Lunak Hari Ini! Google I/O 2026: Pembaruan Gemini, Android XR, dan Inovasi Menarik di Showcase Perangkat Lunak Hari Ini!
Artikel Berikutnya Saham Polandia Ditutup Menurun, WIG30 Turun 1,35% di Akhir Perdagangan Saham Polandia Ditutup Menurun, WIG30 Turun 1,35% di Akhir Perdagangan
- Advertisement -
Ad image

Don't Miss

Korea Selatan Selidiki Kebakaran Kapal di Selat Hormuz, Trump Sebut Serangan Iran sebagai Penyebabnya
Korea Selatan Selidiki Kebakaran Kapal di Selat Hormuz, Trump Sebut Serangan Iran sebagai Penyebabnya
Market
Faktor Katalis Ini Bisa Picu Lonjakan Harga XRP Selanjutnya, Apakah Bisa Sentuh $3?
Faktor Katalis Ini Bisa Picu Lonjakan Harga XRP Selanjutnya, Apakah Bisa Sentuh $3?
Kripto
Trump Mobile Kebobolan Data Pelanggan: Angka Pesanan Jauh di Bawah Perkiraan!
Trump Mobile Kebobolan Data Pelanggan: Angka Pesanan Jauh di Bawah Perkiraan!
Tech
- Advertisement -
Ad image

Baca Juga

Jelajahi insight lain yang sejalan dengan artikel ini!
Insinyur Google Dituntut atas Kecurangan Taruhan Dalam Polymarket Senilai $1,2 Juta
Bisnis

Insinyur Google Dituntut atas Kecurangan Taruhan Dalam Polymarket Senilai $1,2 Juta

Keenan
30 Mei 2026
Dogecoin (DOGE) Berisiko Terkendala, Momentum Kenaikan Terhambat oleh Level Resistensi
Kripto

Dogecoin (DOGE) Berisiko Terkendala, Momentum Kenaikan Terhambat oleh Level Resistensi

Rangga
25 Mei 2026
Alumni OpenAI Diam-Diam Investasi dari Dana Baru yang Berpotensi Capai $100 Juta
Bisnis

Alumni OpenAI Diam-Diam Investasi dari Dana Baru yang Berpotensi Capai $100 Juta

Keenan
7 April 2026
VP Nvidia: Biaya AI Lebih Tinggi Daripada Merekrut Karyawan Manusia
Bisnis

VP Nvidia: Biaya AI Lebih Tinggi Daripada Merekrut Karyawan Manusia

Keenan
30 April 2026
Startup Miami Subquadratic Klaim Efisiensi AI Mencapai 1.000x dengan Model SubQ; Peneliti Serukan Bukti Independen.
Bisnis

Startup Miami Subquadratic Klaim Efisiensi AI Mencapai 1.000x dengan Model SubQ; Peneliti Serukan Bukti Independen.

Keenan
6 Mei 2026
Startup BAND Hadirkan 'Orkestrator Universal': Apa Jadinya Ketika AI Berbicara Satu Sama Lain?
Bisnis

Startup BAND Hadirkan ‘Orkestrator Universal’: Apa Jadinya Ketika AI Berbicara Satu Sama Lain?

Keenan
26 April 2026
XRP Memicu Potensi Lonjakan: Siap-siap untuk Momen Penting!
Kripto

XRP Memicu Potensi Lonjakan: Siap-siap untuk Momen Penting!

Rangga
4 Mei 2026
Block Luncurkan Managerbot: Agen AI Proaktif yang Perkuat Taruhan Jack Dorsey pada Kecerdasan Buatan
Bisnis

Block Luncurkan Managerbot: Agen AI Proaktif yang Perkuat Taruhan Jack Dorsey pada Kecerdasan Buatan

Keenan
8 April 2026
Tampilkan Lebih Banyak
- Advertisement -
Ad image
- Advertisement -
Ad image
Finware

Baca berita keuangan global real-time, insight market APAC, tren bisnis, dan crypto paling komprehensif. Curi start sebelum market bergerak.

  • Kanal:
  • Market
  • Bisnis
  • Tech
  • Kripto

Personal

  • Riwayat
  • Disimpan
  • Feed
  • Topik Pilihan

Tentang Kami

  • Beranda
  • Hubungi Kami

© 2026 Finware Media. All Right Reserved.

Welcome Back!

Sign in to your account

Nama Pengguna atau Alamat Email
Kata Sandi

Lupa kata sandi Anda?