AI summary
Pelanggaran keamanan Claude Mythos menunjukkan kerentanan dalam sistem keamanan meskipun klaim tinggi tentang keselamatan AI. Pentingnya memantau akses dan menggunakan informasi yang ada untuk mengantisipasi potensi pelanggaran. Kejadian ini bisa merusak reputasi perusahaan yang mengklaim sebagai pemimpin dalam keselamatan AI. Anthropic meluncurkan Claude Mythos, model AI yang diklaim sangat kuat di bidang cybersecurity dan dianggap terlalu berbahaya untuk dirilis secara publik. Namun, setelah lama mengontrol aksesnya, model tersebut bocor ke pihak yang tidak berwenang melalui cara yang relatif sederhana dan tidak rumit. Kejadian ini mengganggu reputasi perusahaan yang mengedepankan keamanan AI tingkat tinggi.Kelompok tidak resmi berhasil mengakses Mythos dengan menebak lokasi model secara daring menggunakan informasi bocor dari perusahaan Mercor serta akses kontrak dari salah satu anggota kelompok tersebut. Anthropic sebenarnya memiliki kemampuan untuk melacak penggunaan model, tetapi gagal memantau secara efektif sehingga pelanggaran ini tidak terdeteksi lebih awal. Kelompok tersebut pun tidak menggunakan model untuk aktivitas cybersecurity agar tidak terdeteksi.Kebocoran ini menimbulkan pertanyaan terkait kesiapan Anthropic dalam mengelola risiko keamanan terutama ketika meluncurkan produk yang sangat sensitif. Ini juga menjadi peringatan bagi industri AI mengenai pentingnya pengelolaan akses dan keamanan yang ketat. Anthropic diperkirakan akan memperbaiki sistem pengawasan dan menutup celah keamanan di rantai pasokannya agar kejadian serupa tidak terulang.
Anthropic tampak terlalu percaya diri dan terlambat menyadari risiko keamanan yang sudah lama dikenal oleh industri. Kegagalan dasar mereka ini menunjukkan bahwa penguatan pengawasan manusia dan sistem log pengguna sangat krusial untuk mencegah akses ilegal, terutama untuk model AI yang sensitif dan kuat seperti Mythos.