Courtesy of SCMP
DeepSeek, sebuah perusahaan AI dari China, dituduh mencuri data dengan menggunakan teknik yang disebut "distillation" untuk melatih model-modelnya yang lebih murah. OpenAI, perusahaan yang mengembangkan ChatGPT, mengklaim memiliki bukti bahwa DeepSeek menggunakan model GPT mereka secara tidak sah untuk membuat model V3 dan R1. Mereka juga sedang menyelidiki apakah DeepSeek mendapatkan data dengan cara yang tidak benar melalui API. Distillation adalah cara untuk melatih model yang lebih kecil agar dapat meniru model yang lebih besar dan canggih.
Meskipun banyak perusahaan teknologi besar menggunakan teknik ini, beberapa ahli mempertanyakan kejujuran OpenAI dalam tuduhan mereka, karena mereka sendiri juga mungkin melanggar ketentuan layanan saat melatih model mereka. DeepSeek mengklaim menggunakan model open-source lain, tetapi OpenAI menuduh mereka menggunakan akses API untuk model GPT yang tertutup secara tidak sah. Hingga saat ini, DeepSeek belum mengakui penggunaan distillation dalam pelatihan model utamanya.
Pertanyaan Terkait
Q
Apa yang dituduhkan kepada DeepSeek terkait model AI mereka?A
DeepSeek dituduh melakukan pencurian data melalui praktik distilasi model yang umum di industri.Q
Apa itu distilasi dalam konteks model AI?A
Distilasi adalah metode pelatihan model yang lebih kecil untuk meniru perilaku model yang lebih besar dan lebih canggih.Q
Siapa yang mengklaim bahwa DeepSeek menggunakan distilasi secara tidak sah?A
OpenAI mengklaim bahwa DeepSeek menggunakan distilasi dari model GPT mereka secara tidak sah.Q
Apa yang dilakukan OpenAI dan Microsoft terkait tuduhan ini?A
OpenAI dan Microsoft mulai menyelidiki apakah kelompok yang terkait dengan DeepSeek telah mencuri data melalui API.Q
Siapa Lutz Finger dan apa pandangannya tentang tuduhan ini?A
Lutz Finger adalah seorang pengajar senior di Cornell University yang mengkritik praktik distilasi dan menyoroti ketidakakuratan dalam tuduhan OpenAI.