Dalam beberapa tahun terakhir, pasar pengantaran makanan online di India mengalami pertumbuhan yang pesat. Baik Zomato maupun Swiggy kini sudah go public, dan jumlah cloud kitchen terus meningkat. Sementara itu, startup yang menawarkan layanan rumah seperti Urban Company, Snabbit, dan Pronto juga semakin populer.
Startup yang berbasis di Silicon Valley, Human Archive, ikut memanfaatkan tren ini dengan bermitra dengan perusahaan-perusahaan tersebut. Mereka mengajak pekerja untuk mengenakan topi khusus yang dilengkapi kamera guna mengumpulkan data video dari sudut pandang pertama saat melakukan tugas sehari-hari, yang nantinya bisa digunakan untuk melatih robot.
Walaupun tidak menyebutkan nama mitra spesifik, Human Archive mengungkapkan bahwa mereka bekerja dengan beberapa perusahaan dalam sektor layanan rumah, hotel, dan restoran untuk mengumpulkan data tersebut. Mereka kini sudah menempatkan lebih dari 1.000 headset aktif di berbagai lokasi.
Baru-baru ini, Human Archive mengumumkan telah berhasil mengumpulkan dana sebesar $8,2 juta dari Wing Venture Capital, NVP Capital, Y Combinator, serta para investor angel dari OpenAI, Nvidia, Google, Mercor, AfterQuery, BAIR, SAIL, Brad Boa, dan Meta.
Startup ini didirikan oleh empat mahasiswa, yaitu Samay Maini, Rushil Agarwal, Shloke Patel, dan Raj Patel, di mana dua di antaranya adalah sepupu. Raj Patel menjabat sebagai CEO. Keempat pendiri ini memiliki latar belakang riset di bidang robotika, perangkat keras, dan data sentuh.
Pendirian perusahaan ini adalah taruhan langsung terhadap arah industri AI. Saat laboratorium robotika dan perusahaan AI terdepan berlomba-lomba menciptakan mesin yang dapat melakukan tugas fisik di dunia nyata, mereka menghadapi kendala yang signifikan: kekurangan data pelatihan berkualitas tinggi yang menunjukkan manusia melakukan pekerjaan sehari-hari. Human Archive percaya bahwa pekerja di ekonomi gig yang berkembang pesat di India adalah sumber data yang belum dimanfaatkan dan scalable.
Meskipun Human Archive tengah bekerja dengan berbagai mitra, mereka mengalami penolakan dari beberapa perusahaan layanan rumah besar di India, termasuk Pronto dan Urban Company, untuk kolaborasi.
Berita tentang penolakan ini jadi perhatian publik setelah outlet berita India, Entrackr, melaporkan bahwa Pronto kini aktif mencari mitra untuk mengumpulkan data pekerja demi pelatihan robotika. Snabbit juga sempat melakukan diskusi awal dengan Human Archive sebelum proyek ini gagal. CEO Urban Company, Abhiraj Singh Bhal, menjawab kritik secara terbuka di X, menyatakan perusahaan tidak akan terlibat dalam kerjasama semacam itu. Patel langsung membalas bahwa Urban Company harus segera mempertimbangkan pilihan ini, agar tidak kehilangan relevansi di tengah pergeseran kebutuhan konsumen. Co-founder Rushil Agarwal lebih blak-blakan, mengisahkan bagaimana pendiri Pronto, Anjali Sardana, sempat menertawakannya dan menilai idenya ‘konyol’ saat dia mengajukan gagasan kerjasama data. Pronto mengakui ada pembicaraan tersebut, tetapi memutuskan untuk tidak melanjutkan.
Di berbagai daerah, startup lain juga sedang mengumpulkan data dari lingkungan kerja yang berbeda, termasuk pabrik. Untuk membedakan diri, Human Archive mengembangkan perangkat tambahan seperti sarung tangan sentuh, kostum motion capture seluruh tubuh, dan kamera pergelangan tangan untuk menangkap data gerakan dan kekuatan sentuh, dengan sinkronisasi terhadap data RGB-D (gambar berwarna yang dipadukan secara real-time dengan informasi kedalaman) yang akan dijual ke laboratorium AI. Mereka percaya bahwa data video saja tidak cukup, dan menggabungkannya dengan data sensor lain membuatnya lebih bernilai.
Awalnya, Human Archive menggunakan perangkat sederhana atau peralatan siap pakai untuk menangkap data. Sekarang, mereka tengah mengembangkan perangkat keras kustom yang berfungsi secara bersamaan untuk menangkap berbagai jenis data, dengan lebih dari 50 perangkat berbeda yang sudah digunakan untuk mengumpulkan berbagai data.
“Untuk pengumpulan data, kami mulai menggunakan iPhone; kemudian kami membangun rig dan topi kustom kami sendiri. Sekarang, kami memiliki lebih dari tujuh produk perangkat keras berbeda yang dapat digunakan secara bergantian di berbagai modalitas. Setelah mengumpulkan data dari berbagai perangkat, kami bekerja untuk menyinkronkan data dari semua sumber berbeda ini,” jelas Patel dalam sebuah percakapan.
Perusahaan ini berencana mengembangkan cara untuk menyempurnakan model AI dengan data mereka sendiri dan mengujinya pada robot untuk mengevaluasi efektivitas tugas. Dengan cara ini, startup bisa menunjukkan kualitas data mereka kepada calon pelanggan serta melatih model internal.
Zach DeWitt, partner di Wing VC, menyebutkan bahwa Human Archive memiliki keuntungan unik dalam mengumpulkan data dari berbagai sensor.
“Tidak ada siapa pun di dunia ini yang bisa menyinkronkan dan mengumpulkan headset RGB-D, umpan balik kekuatan, motion capture seluruh tubuh, dan data kamera dada serta pergelangan tangan secara berskala. Mereka sudah melakukan pelatihan model internal dengan data ini, dan semua laboratorium besar serta universitas tertarik untuk melakukan eksperimen dengan data ini karena keunikan sensor dan ukuran dataset baru yang akan mereka rilis segera,” tuturnya kepada TechCrunch.
Pengumpulan data di India dan rencana ekspansi
Meski ditolak oleh pemain besar dalam industri layanan rumah, Human Archive bekerja sama dengan startup kecil untuk menawarkan layanan dengan harga diskon kepada pelanggan. Ketika pekerja datang ke rumah, konsumen diberikan pilihan melalui aplikasi: membayar harga diskon dengan memberikan izin untuk pengumpulan data, atau membayar harga penuh untuk kunjungan tanpa rekaman.
Patel menyebutkan bahwa pelanggan senang memilih opsi pertama, mengingat sengketa tentang kualitas layanan cukup umum dan rekaman video bisa membantu menyelesaikan masalah tersebut.
Perusahaan ini membayar pekerja dengan tarif dasar $1 per jam untuk berpartisipasi dalam pengumpulan data egosentris. Sebuah laporan dari Economic Times menunjukkan bahwa perusahaan lain membayar ₹250 hingga ₹400 per jam (sekitar $2,63 hingga $4,20). Patel menyebutkan bahwa pesaingnya membayar lebih banyak dibandingkan dengan Human Archive, tetapi kehadiran mereka di lapangan di India memungkinkan mereka untuk menjaga kompensasi tetap lebih rendah.
“Jaringan Human Archive memberikan peluang penghasilan yang cepat dan fleksibel secara global, menurunkan hambatan untuk berpartisipasi dalam ekonomi AI. Kami melihat ini sebagai jembatan penting yang mendanai mata pencaharian segera sementara membangun infrastruktur untuk masa depan yang lebih aman dan produktif,” ungkap DeWitt.
Namun, ada kekhawatiran terkait privasi seputar pengumpulan data melalui rekaman video. Masih belum jelas informasi apa yang diberikan Human Archive kepada pekerja mengenai penggunaan rekaman mereka. Perusahaan menyatakan bahwa kontrak komersial mereka sudah sesuai dengan UU Perlindungan Data Pribadi Digital (DPDP) India, dengan menampilkan pemberitahuan kebijakan privasi, serta informasi persetujuan yang menjelaskan tujuan pengumpulan data dan bagaimana data tersebut diproses. Mereka menyatakan bahwa semua data dianonimkan dan wajah dalam rekaman diburamkan. Minggu lalu, Moneycontrol melaporkan bahwa Kementerian Elektronik dan Teknologi Informasi India sedang menyelidiki mekanisme persetujuan dan praktik pengumpulan data startup yang mengumpulkan data egosentris melalui pekerja layanan rumah.
Sementara Human Archive banyak mengumpulkan data di India, mereka juga mulai berekspansi ke Asia Tenggara dan AS. Perusahaan ini sedang membangun platform dimana siapa pun dapat berpartisipasi dalam pengumpulan data dan mendapatkan uang. Mereka juga ingin menawarkan layanan seperti pembersihan atau memasak di AS sebagai imbalan pengumpulan data oleh pekerja yang berpartisipasi — meskipun program-program ini masih dalam tahap awal percobaan.
Beberapa startup yang didanai dengan baik berlomba-lomba membangun AI fisik. Hal ini membutuhkan banyak sekali data pelatihan yang menunjukkan manusia bekerja — dan Human Archive adalah salah satu pemain yang bersaing memenuhi permintaan tersebut. Seberapa jauh pendekatan mereka dapat meluas akan tergantung pada kemitraan yang mereka bangun serta keunikan dan volume data yang dapat mereka kumpulkan untuk memenuhi kebutuhan laboratorium AI fisik.

