Courtesy of SCMP
DeepSeek, sebuah perusahaan rintisan dari Tiongkok, baru saja meluncurkan model bahasa besar (LLM) terbaru mereka yang bernama DeepSeek V3. Model ini dilatih selama dua bulan dengan biaya sekitar 5,58 juta dolar AS dan memiliki 671 miliar parameter. Hasil pengujian menunjukkan bahwa DeepSeek V3 mampu mengungguli model-model dari perusahaan besar seperti Meta dan OpenAI, meskipun menggunakan sumber daya komputasi yang jauh lebih sedikit. Banyak ahli, termasuk Andrej Karpathy dari OpenAI, mengakui keberhasilan DeepSeek dalam menciptakan model AI yang kuat dengan biaya yang relatif rendah.
Keberhasilan DeepSeek menunjukkan kemajuan pesat perusahaan AI Tiongkok, meskipun mereka menghadapi tantangan dari sanksi AS yang membatasi akses mereka ke teknologi semikonduktor canggih. Model LLM ini penting karena dapat digunakan dalam berbagai layanan AI generatif, seperti ChatGPT, dan memiliki kemampuan untuk memahami pola data yang kompleks serta membuat prediksi yang akurat.
Pertanyaan Terkait
Q
Apa yang dilakukan oleh DeepSeek?A
DeepSeek adalah perusahaan rintisan yang mengembangkan model bahasa besar (LLM) yang bersaing dengan model dari perusahaan besar lainnya.Q
Berapa banyak parameter yang dimiliki model V3 dari DeepSeek?A
Model V3 dari DeepSeek memiliki 671 miliar parameter.Q
Siapa yang memberikan komentar tentang model DeepSeek?A
Andrej Karpathy, seorang ilmuwan komputer dan anggota tim pendiri OpenAI, memberikan komentar tentang model DeepSeek.Q
Apa yang dimaksud dengan 'open weights' dalam konteks model AI?A
'Open weights' merujuk pada pelepasan hanya parameter yang telah dilatih dari model AI, memungkinkan pihak ketiga untuk menggunakan model tersebut untuk inferensi dan fine-tuning.Q
Mengapa DeepSeek dapat mengembangkan model AI dengan biaya yang lebih rendah?A
DeepSeek dapat mengembangkan model AI dengan biaya yang lebih rendah karena menggunakan sumber daya komputasi yang lebih sedikit dibandingkan dengan perusahaan besar seperti Meta dan OpenAI.