Courtesy of TechCrunch
Ai2, sebuah lembaga penelitian AI nirlaba yang berbasis di Seattle, baru saja meluncurkan model AI baru bernama Tulu3-405B. Model ini diklaim lebih unggul dibandingkan dengan DeepSeek V3 dari perusahaan China dan juga OpenAI’s GPT-4o dalam beberapa pengujian. Yang menarik, Tulu3-405B bersifat open source, artinya semua orang bisa mengakses dan mengembangkan model ini secara gratis. Ai2 percaya bahwa peluncuran ini menunjukkan potensi Amerika Serikat untuk memimpin dalam pengembangan model AI generatif yang terbaik di dunia.
Tulu3-405B adalah model yang sangat besar, dengan 405 miliar parameter, dan memerlukan 256 GPU untuk dilatih. Salah satu teknik yang digunakan untuk mencapai kinerja yang baik adalah pembelajaran penguatan dengan hadiah yang dapat diverifikasi. Dalam pengujian, Tulu3-405B berhasil mengalahkan model-model lain dalam menjawab pertanyaan dan menyelesaikan masalah matematika tingkat sekolah dasar. Model ini dapat diuji melalui aplikasi chatbot Ai2 dan kode untuk melatih model ini tersedia di GitHub dan platform AI Hugging Face.
Pertanyaan Terkait
Q
Apa yang diluncurkan oleh Ai2 baru-baru ini?A
Ai2 baru-baru ini meluncurkan model AI yang disebut Tulu3-405B.Q
Apa keunggulan Tulu3-405B dibandingkan model AI lainnya?A
Tulu3-405B diklaim mengungguli DeepSeek V3 dan OpenAI GPT-4o dalam beberapa benchmark AI.Q
Mengapa Tulu3-405B dianggap sebagai model AI terbuka?A
Tulu3-405B dianggap sebagai model AI terbuka karena semua komponen yang diperlukan untuk mereplikasinya tersedia secara bebas dan dilisensikan dengan permisif.Q
Apa teknik yang digunakan untuk melatih Tulu3-405B?A
Teknik yang digunakan untuk melatih Tulu3-405B adalah reinforcement learning dengan verifiable rewards.Q
Siapa saja pesaing utama Tulu3-405B di pasar AI?A
Pesaing utama Tulu3-405B di pasar AI termasuk DeepSeek V3, OpenAI GPT-4o, dan Meta Llama 3.1.