Ai2 mengatakan bahwa model AI barunya mengalahkan salah satu yang terbaik dari DeepSeek.
Courtesy of TechCrunch

Rangkuman Berita: Ai2 mengatakan bahwa model AI barunya mengalahkan salah satu yang terbaik dari DeepSeek.

TechCrunch
Dari TechCrunch
30 Januari 2025 pukul 21.00 WIB
90 dibaca
Share
Ai2, sebuah lembaga penelitian AI nirlaba yang berbasis di Seattle, baru saja meluncurkan model AI baru bernama Tulu3-405B. Model ini diklaim lebih unggul dibandingkan dengan DeepSeek V3 dari perusahaan China dan juga OpenAI’s GPT-4o dalam beberapa pengujian. Yang menarik, Tulu3-405B bersifat open source, artinya semua orang bisa mengakses dan mengembangkan model ini secara gratis. Ai2 percaya bahwa peluncuran ini menunjukkan potensi Amerika Serikat untuk memimpin dalam pengembangan model AI generatif yang terbaik di dunia.
Tulu3-405B adalah model yang sangat besar, dengan 405 miliar parameter, dan memerlukan 256 GPU untuk dilatih. Salah satu teknik yang digunakan untuk mencapai kinerja yang baik adalah pembelajaran penguatan dengan hadiah yang dapat diverifikasi. Dalam pengujian, Tulu3-405B berhasil mengalahkan model-model lain dalam menjawab pertanyaan dan menyelesaikan masalah matematika tingkat sekolah dasar. Model ini dapat diuji melalui aplikasi chatbot Ai2 dan kode untuk melatih model ini tersedia di GitHub dan platform AI Hugging Face.

Pertanyaan Terkait

Q
Apa yang diluncurkan oleh Ai2 baru-baru ini?
A
Ai2 baru-baru ini meluncurkan model AI yang disebut Tulu3-405B.
Q
Apa keunggulan Tulu3-405B dibandingkan model AI lainnya?
A
Tulu3-405B diklaim mengungguli DeepSeek V3 dan OpenAI GPT-4o dalam beberapa benchmark AI.
Q
Mengapa Tulu3-405B dianggap sebagai model AI terbuka?
A
Tulu3-405B dianggap sebagai model AI terbuka karena semua komponen yang diperlukan untuk mereplikasinya tersedia secara bebas dan dilisensikan dengan permisif.
Q
Apa teknik yang digunakan untuk melatih Tulu3-405B?
A
Teknik yang digunakan untuk melatih Tulu3-405B adalah reinforcement learning dengan verifiable rewards.
Q
Siapa saja pesaing utama Tulu3-405B di pasar AI?
A
Pesaing utama Tulu3-405B di pasar AI termasuk DeepSeek V3, OpenAI GPT-4o, dan Meta Llama 3.1.

Rangkuman Berita Serupa

o3-Mini dari OpenAI adalah model AI yang lebih ramping yang dapat bersaing dengan DeepSeek.Wired
Teknologi
2 bulan lalu
31 dibaca
o3-Mini dari OpenAI adalah model AI yang lebih ramping yang dapat bersaing dengan DeepSeek.
Bagaimana DeepSeek mengubah lanskap AI di Silicon ValleyTechCrunch
Teknologi
2 bulan lalu
103 dibaca
Bagaimana DeepSeek mengubah lanskap AI di Silicon Valley
Alibaba China bergabung dalam pertempuran AI, menyatakan model baru mereka lebih unggul dibandingkan ChatGPT, DeepSeek, dan Llama.InterestingEngineering
Teknologi
2 bulan lalu
80 dibaca
Alibaba China bergabung dalam pertempuran AI, menyatakan model baru mereka lebih unggul dibandingkan ChatGPT, DeepSeek, dan Llama.
Alibaba Meluncurkan Qwen 2.5: Saingan DeepSeek?Forbes
Teknologi
2 bulan lalu
157 dibaca
Alibaba Meluncurkan Qwen 2.5: Saingan DeepSeek?
Alibaba merilis model AI yang diklaimnya melampaui DeepSeek-V3.TheJakartaPost
Teknologi
2 bulan lalu
59 dibaca
Alibaba merilis model AI yang diklaimnya melampaui DeepSeek-V3.
Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing ASWired
Teknologi
2 bulan lalu
49 dibaca
Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing AS