Courtesy of SCMP
Ikhtisar 15 Detik
- DeepSeek V3 memiliki kemampuan yang lebih baik dalam pemrograman dan matematika.
- Model baru ini diluncurkan dengan lisensi MIT yang populer di kalangan pengembang.
- DeepSeek-V3-0324 menjadi model teratas di Hugging Face dengan banyak komentar positif.
DeepSeek, sebuah perusahaan kecerdasan buatan (AI) dari China, telah meluncurkan versi terbaru dari model bahasa besar mereka yang disebut DeepSeek-V3-0324. Model ini memiliki lebih banyak parameter dan kemampuan yang lebih baik dalam pemrograman serta menyelesaikan masalah matematika. Versi baru ini juga memiliki kemampuan berpikir yang lebih baik, pengembangan web yang lebih optimal, dan kemampuan menulis dalam bahasa Mandarin yang lebih baik. DeepSeek-V3-0324 kini menjadi model yang paling banyak dibicarakan di platform AI Hugging Face.
Model ini telah menunjukkan peningkatan yang signifikan dalam beberapa tes, seperti ujian matematika AIME, di mana skor model baru mencapai 59,4, jauh lebih tinggi dibandingkan dengan 39,6 dari versi sebelumnya. DeepSeek-V3-0324 memiliki 685 miliar parameter dan menggunakan lisensi perangkat lunak MIT, yang populer di kalangan pengembang. Model ini dapat digunakan dalam berbagai aplikasi, termasuk sebagai chatbot.
Pertanyaan Terkait
Q
Apa yang diupgrade dalam model DeepSeek V3?A
Model DeepSeek V3 diupgrade dengan menambahkan parameter dan meningkatkan kemampuan dalam pemrograman dan pemecahan masalah matematika.Q
Berapa banyak parameter yang dimiliki DeepSeek V3?A
DeepSeek V3 memiliki 671 miliar parameter, sedangkan model baru memiliki 685 miliar parameter.Q
Apa yang ditunjukkan oleh skor AIME DeepSeek V3?A
Skor AIME DeepSeek V3 menunjukkan peningkatan dari 39.6 menjadi 59.4.Q
Di mana DeepSeek-V3-0324 diluncurkan?A
DeepSeek-V3-0324 diluncurkan di komunitas AI Hugging Face dan situs web perusahaan.Q
Apa lisensi yang digunakan oleh model baru ini?A
Model baru ini menggunakan lisensi perangkat lunak MIT.