Courtesy of TechCrunch
Tim dari platform pengembangan AI, Hugging Face, telah merilis model AI terkecil yang dapat menganalisis gambar, video pendek, dan teks, yaitu SmolVLM-256M dan SmolVLM-500M. Model ini dirancang untuk digunakan pada perangkat dengan spesifikasi rendah, seperti laptop dengan RAM kurang dari 1GB, dan cocok untuk pengembang yang ingin memproses data dalam jumlah besar dengan biaya rendah. SmolVLM-256M memiliki 256 juta parameter, sedangkan SmolVLM-500M memiliki 500 juta parameter. Keduanya dapat melakukan tugas seperti mendeskripsikan gambar atau video dan menjawab pertanyaan tentang dokumen PDF.
Meskipun model-model kecil ini murah dan serbaguna, mereka juga memiliki kelemahan yang tidak terlihat pada model yang lebih besar. Penelitian terbaru menunjukkan bahwa banyak model kecil kurang efektif dalam tugas penalaran yang kompleks. Hal ini mungkin disebabkan oleh fakta bahwa model kecil lebih baik dalam mengenali pola permukaan dalam data, tetapi kesulitan menerapkan pengetahuan tersebut dalam konteks baru.
Pertanyaan Terkait
Q
Apa itu SmolVLM-256M dan SmolVLM-500M?A
SmolVLM-256M dan SmolVLM-500M adalah model AI yang dapat menganalisis gambar, video pendek, dan teks dengan ukuran 256 juta dan 500 juta parameter.Q
Siapa yang mengembangkan model-model ini?A
Model-model ini dikembangkan oleh tim di Hugging Face.Q
Apa keunggulan dari model-model kecil ini?A
Keunggulan dari model-model kecil ini adalah mereka dapat bekerja pada perangkat dengan RAM terbatas dan memproses data dengan biaya rendah.Q
Apa yang ditemukan dalam studi terbaru mengenai model kecil?A
Studi terbaru menemukan bahwa banyak model kecil berkinerja lebih buruk dari yang diharapkan pada tugas penalaran kompleks.Q
Bagaimana cara menggunakan model SmolVLM?A
Model SmolVLM dapat digunakan secara online atau diunduh dari Hugging Face di bawah lisensi Apache 2.0.