Courtesy of TechCrunch
AI2, yang sebelumnya dikenal sebagai Allen Institute for AI, berusaha menjembatani kesenjangan antara komunitas AI sumber terbuka dan perusahaan besar dengan menyediakan basis data dan model yang sepenuhnya terbuka. Mereka menyadari bahwa model bahasa besar (LLM) tidak langsung siap digunakan setelah proses pelatihan awal, dan proses pasca-pelatihan justru menjadi kunci untuk membuat model tersebut berguna. AI2 mengembangkan Tülu 3, sebuah proses pasca-pelatihan yang lebih baik, yang memungkinkan pengguna untuk menyesuaikan model sesuai kebutuhan mereka, seperti meningkatkan kemampuan matematika dan pemrograman.
Dengan Tülu 3, AI2 ingin membuat proses ini lebih mudah diakses bagi pengembang, sehingga mereka tidak perlu bergantung pada perusahaan besar yang mungkin mengharuskan mereka untuk menggunakan sumber daya luar yang dapat membahayakan data sensitif. AI2 berkomitmen untuk transparansi dan akan segera merilis model yang sepenuhnya sumber terbuka, yang diharapkan dapat memberikan peningkatan lebih lanjut dibandingkan model yang ada saat ini.
Pertanyaan Terkait
Q
Apa tujuan utama AI2 dalam pengembangan model AI?A
Tujuan utama AI2 adalah menciptakan model AI yang terbuka dan dapat diakses, serta meningkatkan kegunaan model bahasa besar.Q
Apa yang dimaksud dengan proses pelatihan pasca dalam konteks model bahasa besar?A
Proses pelatihan pasca adalah tahap di mana model bahasa besar dimodifikasi untuk meningkatkan kemampuannya dan membuatnya lebih berguna.Q
Mengapa perusahaan besar seperti Meta dan OpenAI menjaga kerahasiaan proses pelatihan mereka?A
Perusahaan besar menjaga kerahasiaan proses pelatihan mereka untuk melindungi metode dan sumber data yang digunakan dalam pengembangan model.Q
Apa perbedaan antara Tülu 2 dan Tülu 3?A
Tülu 3 adalah peningkatan signifikan dari Tülu 2, dengan hasil pengujian yang lebih baik dan proses pelatihan yang lebih canggih.Q
Bagaimana AI2 berencana untuk meningkatkan model OLMo yang berbasis Tülu 3?A
AI2 berencana untuk merilis model OLMo yang dilatih dengan Tülu 3, yang diharapkan menawarkan peningkatan lebih lanjut dan sepenuhnya terbuka.