Permintaan terhadap kecerdasan buatan (AI) saat ini memberi tekanan berat pada rantai pasokan di seluruh siklus pengembangan. Sektor teknologi belum pernah merasakan tantangan seperti ini.
Konsekuensi dari perlombaan membangun lebih banyak alat AI, melatih model-model canggih, dan mengotomatisasi alur kerja, telah menyebabkan lonjakan konstruksi global. Perusahaan-perusahaan besar, atau yang dikenal sebagai hyperscalers, menginvestasikan ratusan miliar dolar dalam proyek pusat data besar yang semakin mendapat sorotan sosial dan lingkungan.
Perusahaan kini menghadapi reaksi negatif terkait penggunaan sumber daya, seperti konsumsi listrik dan air, penggunaan lahan, serta ekspansi jaringan yang menjadi tantangan terbesar bagi hyperscalers, selain berurusan dengan rantai pasokan yang tegang.
Kami mulai melihat komputasi perangkat lokal, edge, dan on-device sebagai alternatif yang layak untuk komputasi cloud, dan manfaatnya sangat luas. Misalnya, ini tidak hanya mengatasi keberatan terhadap kampus data besar tetapi juga memberikan koneksi dengan latensi lebih rendah dan biaya yang lebih dapat diprediksi bagi pelanggan perusahaan.
AI dan cloud telah menjadi sinonim, tetapi memiliki edge AI bisa jadi keuntungan kompetitif berikutnya
Integrasi yang lebih erat dengan sistem berlapis hybrid dan on-premise mungkin menjadi langkah selanjutnya dalam perkembangan AI. Sementara chatbot AI generatif dan alat produktivitas dasar bekerja dengan baik di dalam browser, otomatisasi alur kerja dan konteks penuh mengharuskan kita untuk memikirkan kembali lapisan infrastruktur.
Bagi Amit Shah, co-founder dan CEO InstaLILY AI, keuntungan kompetitif kini datang dalam bentuk kecerdasan yang dimiliki, di mana sistem perusahaan dapat belajar dari operasi, alur kerja, dan pengetahuan organisasional. Pendekatan “Small Data Center” perusahaan ini mengklaim telah mengurangi waktu pengiriman logistik dari 15 menit menjadi 3 menit, serta mengurangi waktu pelatihan tim lapangan sebesar 60% untuk operator industri.
Untuk lebih memahami apakah masa depan AI perusahaan memang semakin terdistribusi, Shah membahas batasan cloud, perbedaan kebutuhan antara AI tingkat perusahaan dan alat konsumen, serta peran hyperscalers dalam evolusi ini.
- InstaLILY meluncurkan apa yang mereka sebut “Pendekatan Small Data Center.” Apa bedanya dengan instalasi edge yang sudah ada selama bertahun-tahun? Apakah middleware adalah kunci rahasianya?
Instalasi edge selama ini diperuntukkan bagi perangkat dengan tujuan tunggal yang menjalankan inferensi sempit. Pendekatan “Small Data Center” kami beroperasi secara berbeda dengan tumpukan kecerdasan penuh.
Seluruh proses, pekerja, dan tata kelola berjalan secara privat, dekat dengan tempat kerja, dan terhubung ke cloud sebagai satu sistem. Didukung oleh InstaBrain, lapisan kecerdasan yang dibangun dari pengetahuan perusahaan yang bersifat proprietary, dengan InstaWorkers™, pekerja AI yang langsung beroperasi di dalam sistem yang ada dengan kecerdasan lokal dan sentralisasi yang diatur oleh InstaControl.
Kunci sebenarnya bukan pada middleware tetapi pada pergeseran cara memandang cloud dan edge. Pemikiran mendalam seharusnya berlangsung di mana perhitungan terpusat masuk akal, sedangkan eksekusi operasional dengan frekuensi tinggi lebih baik dilakukan dekat dengan tempat bekerja. Lapisan kecerdasan mengetahui perbedaannya, dan itulah perubahan nyata.
- Apa yang salah dengan mengandalkan “infrastruktur cloud jarak jauh yang masif” secara eksklusif? Mengingat mereka menawarkan redundansi secara default dan model OPEX, apa ini menjadi kombinasi sempurna untuk bisnis dari berbagai ukuran?
Tidak ada yang salah dengan mengandalkan infrastruktur cloud jarak jauh yang besar selama pekerjaanmu berlangsung di dalam tab browser. Cloud hyperscale sangat baik dalam penalaran elastis dan redundansi yang sangat baik. Namun, itu kurang cocok untuk eksekusi operasional di ekonomi fisik.
Asumsi bahwa AI industri hanya akan hidup di cloud mengabaikan bagaimana operasi industri benar-benar bekerja. Pabrik, gudang, dan jaringan logistik beroperasi di bawah persyaratan latensi yang ketat, konektivitas yang tidak konsisten, dan tekanan yang konstan untuk mengontrol biaya.
Bahkan ketika konektivitas bukan menjadi masalah, endpoint model generik kekurangan konteks operasional yang paling penting, seperti katalog spesifik perusahaan, alur kerja, logika pengecualian, dan pengetahuan institusional yang diperoleh selama bertahun-tahun.
Terlepas seberapa canggih modelnya, para produsen tidak akan menyerahkan keputusan penting kepada sistem yang tidak dapat mereka kendalikan, audit, atau percayai. OPEX dan redundansi memang memberi manfaat, tetapi mereka tidak menyelesaikan masalah yang tepat ketika alur kerja itu sendiri tidak hidup di cloud.
- Kita sudah memiliki komputasi terdistribusi selama beberapa dekade: dari Blockchain hingga P2P, dari bit-torrent hingga Skype. Apa yang berbeda kali ini? Apakah AI sedang memperkuat kebutuhan akan sesuatu yang berbeda dan bertindak sebagai katalis?
Gelombang awal sistem terdistribusi memindahkan file, transaksi, atau siklus komputasi di sekitar jaringan. Kali ini, komputasi memindahkan kecerdasan melalui perubahan kategorikal.
AI adalah katalisnya karena ini adalah beban kerja pertama di mana nilai terakumulasi di edge. Setiap keputusan, pengecualian, dan alur kerja berkontribusi pada lapisan kecerdasan privat yang semakin kapabel dari waktu ke waktu.
Teknologi terdistribusi sebelumnya membantu organisasi berbagi sumber daya dengan lebih efisien, karena mereka tidak menciptakan pengetahuan proprietary. BitTorrent tidak menjadi lebih pintar seiring penggunaannya, meskipun lapisan kecerdasannya terus meningkat.
Era persaingan bisnis berikutnya tidak akan ditentukan oleh siapa yang memiliki akses ke AI, tetapi oleh siapa yang memiliki kecerdasan yang dihasilkan oleh operasi mereka.
- Jika komputasi terdistribusi sangat menguntungkan bagi semua pihak dalam ekosistem AI, mengapa kita tidak melihat hyperscalers mendukung teknologi ini secara lebih kuat?
Ekonomi memberikan hadiah kepada konsumsi terpusat. Inferensi terdistribusi mengompresi biaya per-token dan memperumit peta jalan yang dibangun di sekitar pelatihan pusat yang semakin besar. Mereka tidak mengabaikannya, tetapi bergerak dengan hati-hati karena menggerogoti inferensi terpusat tidak nyaman, terutama ketika itu adalah inti bisnis mereka.
Tarikan ini berasal dari ekonomi fisik ke luar, bukan dari hyperscalers ke dalam. Perusahaan yang paling menekankan hal ini adalah yang pelanggannya merasakan kesakitan dari arsitektur cloud saja, seperti produsen, operator industri, bisnis layanan lapangan, dan jaringan logistik. Siapa pun yang pekerjaannya tidak terjadi di tab browser.
- Anda telah menyaksikan evolusi AI (atau lebih tepatnya AI generatif) sebagai bagian integral dari itu. Bagaimana Anda melihatnya berkembang dalam 5 tahun ke depan? Apakah kita berada dalam gelembung yang dipicu AI?
Perpecahan yang menentukan dalam perangkat lunak perusahaan dalam lima tahun ke depan akan terjadi antara perusahaan yang menyewa kecerdasan versus perusahaan yang memilikinya. Perlombaan model perbatasan terus berlanjut, tetapi nilai akan terakumulasi di lapisan yang mengubah kemampuan model menjadi eksekusi operasional.
AI otonom bergerak dari saran ke tindakan, dari antarmuka ke infrastruktur, dan dari alat yang digunakan menjadi sistem yang menjalankan pekerjaan.
Lingkungan modal saat ini memang sangat menggembirakan, tetapi pergeseran teknologi yang mendasarinya tidak. Kegembiraan semacam ini adalah bagaimana setiap transisi platform besar dalam sejarah dimulai.
Para pemenang jangka panjang adalah perusahaan yang membangun kecerdasan operasional menjadi aset yang terakumulasi, bukan yang sekadar membeli GPU terbanyak.

