Courtesy of TechCrunch
Ikhtisar 15 Detik
- BitNet b1.58 2B4T adalah model AI 1-bit terbesar yang efisien dan cepat.
- Kuantisasi bobot menjadi tiga nilai (-1, 0, 1) meningkatkan efisiensi memori dan kecepatan.
- Bitnet.cpp memiliki keterbatasan kompatibilitas yang perlu diatasi untuk penggunaan yang lebih luas.
Amerika Serikat - Para peneliti Microsoft telah mengembangkan model AI 1-bit terbesar yang disebut BitNet b1.58 2B4T. Model ini dirancang untuk berjalan pada perangkat keras ringan dengan mengkuantisasi bobot menjadi hanya tiga nilai: -1, 0, dan 1, sehingga lebih efisien dalam penggunaan memori dan komputasi.
BitNet b1.58 2B4T memiliki 2 miliar parameter dan dilatih pada dataset 4 triliun token, setara dengan sekitar 33 juta buku. Model ini mengungguli model tradisional dengan ukuran serupa dalam beberapa benchmark seperti GSM8K dan PIQA, serta lebih cepat dalam beberapa kasus.
Namun, untuk mencapai kinerja tersebut, model ini memerlukan kerangka kerja khusus Microsoft, bitnet.cpp, yang saat ini hanya bekerja dengan perangkat keras tertentu dan tidak mendukung GPU. Meskipun demikian, bitnets menunjukkan potensi besar, terutama untuk perangkat dengan sumber daya terbatas.
Pertanyaan Terkait
Q
Apa itu BitNet b1.58 2B4T?A
BitNet b1.58 2B4T adalah model AI 1-bit terbesar yang dikembangkan oleh Microsoft, yang dapat berjalan di CPU.Q
Bagaimana cara kerja kuantisasi dalam model AI?A
Kuantisasi dalam model AI mengurangi jumlah bit yang diperlukan untuk merepresentasikan bobot, sehingga model dapat berjalan lebih efisien di perangkat dengan memori terbatas.Q
Apa keunggulan BitNet dibandingkan model AI lainnya?A
BitNet mengungguli model AI lain dalam hal kecepatan dan efisiensi memori, meskipun tidak selalu mengalahkan semua model sebanding.Q
Mengapa bitnet.cpp menjadi kendala dalam penggunaan BitNet?A
Bitnet.cpp hanya mendukung perangkat keras tertentu dan tidak kompatibel dengan GPU, yang merupakan infrastruktur dominan untuk AI.Q
Apa saja entitas yang dibandingkan dengan BitNet dalam pengujian?A
Entitas yang dibandingkan dengan BitNet dalam pengujian termasuk Llama 3.2, Gemma 3, dan Qwen 2.5.