Google Cloud menangguhkan akun Railway setelah aktivitas mencurigakan
Gangguan selama berjam-jam ini berdampak pada semua beban kerja Railway di seluruh cloud
Railway mengambil tanggung jawab atas kelalaian tersebut akibat ketergantungan teknis
Perusahaan Platform-as-a-Service (PaaS) Railway mengungkapkan bahwa Google Cloud tiba-tiba menangguhkan akunnya tanpa pemberitahuan sebelumnya, yang mengakibatkan gangguan selama beberapa jam. Railway, yang melayani lebih dari tiga juta pengguna dengan sekitar 10 juta layanan, API, dan database, mendeteksi masalah pada pukul 10:20 malam UTC pada 19 Mei 2026, dan baru berhasil diperbaiki penuh delapan jam kemudian sekitar pukul 6:14 pagi.
Selama perusahaan menyelidiki penyebab dan berusaha untuk mengembalikan layanan, pelanggan mengalami berbagai kesalahan seperti ‘no healthy upstream’, ‘unconditional drop overload’, kegagalan login, dan ketidakmampuan untuk mengakses dashboard.
Ketergantungan teknis akhirnya menyebabkan gangguan Railway
Karena API kontrol jaringan terpengaruh (yang dihosting di Google Cloud), semua beban kerja Railway di seluruh cloud mengalami masalah, mengembalikan kesalahan 503 dan 404. Beban kerja yang ada tetap berjalan selama sekitar 15 menit sebelum cache mulai kedaluwarsa.
Menurut laporan dari The Register, Railway menghabiskan jumlah delapan digit setiap tahun untuk layanan Google Cloud (kemungkinan lebih dari $1 juta setiap bulan), bahkan setelah memindahkan sebagian infrastruktur mereka ke layanan kolokasi akibat masalah yang terjadi pada tahun 2024 dan 2025.
Railway mengklaim bahwa butuh hampir satu jam bagi Google Cloud untuk merespons setelah insiden itu terjadi. “Kami sangat marah dan masih mencoba mendapatkan semua detailnya,” ungkap Solutions Engineer Angelo Saraceno. Menariknya, akun Railway dicabut penangguhannya pada pukul 10:29 malam, hanya sembilan menit setelah masalah muncul.
Sejak saat itu, perusahaan ini menerbitkan postingan blog yang mendetailkan segala informasi yang mereka ketahui tentang insiden tersebut, dikombinasikan dengan informasi dari Google Cloud.
Laporan tersebut mengonfirmasi bahwa gangguan itu bagian dari penyepuhan otomatis yang lebih luas oleh Google yang berdampak pada akun Google Cloud Platform lainnya tanpa pemberitahuan sebelumnya. TechRadar Pro mencatat bahwa Google Cloud mengidentifikasi lonjakan aktivitas penyalahgunaan, khususnya pertambangan cryptocurrency, di sejumlah besar akun dan sebelumnya sudah memperingatkan pengguna yang terdampak tentang aktivitas mencurigakan dan kemungkinan kunci keluar.
Ketergantungan eksklusif adalah ide yang buruk
Railway telah mengambil tanggung jawab penuh atas kelalaian ini dan mengumumkan perubahan segera, termasuk menghilangkan ketergantungan eksklusif pada API kontrol jaringan di GCP.
“Jika ada yang tidak berfungsi di salah satu interkoneksi, selalu ada jalur antara cloud satu dan lainnya,” jelas Support Engineer Chandrika Khanduri dan GM Pengalaman Agen Cody De Arkland.
“Kami telah berinvestasi dalam ketahanan akibat insiden sebelumnya yang membantu kami menghadapi dampaknya,” tambah perusahaan, menggambarkan beberapa masalah yang pernah terjadi sebelumnya. Meskipun mereka menjanjikan telah belajar dari kesalahan lalu, tetap saja tanggung jawab Railway untuk menghilangkan ketergantungan GCP mereka, yang dapat mencegah dampak luas kali ini.
“Pelanggan Anda tidak peduli apakah kegagalannya dari Google atau Railway; mereka melihat produk Anda. Peningkatan waktu aktif adalah tanggung jawab kami, dan kami akan terus berkomitmen pada hal itu,” tutup perusahaan dengan tegas.

