Rangkuman berita: Meta merilis dua model AI Llama 4.

Meta baru saja mengumumkan Llama 4, koleksi terbaru dari model AI yang kini digunakan untuk asisten AI Meta di web serta di aplikasi WhatsApp, Messenger, dan Instagram. Ada dua model baru yang diperkenalkan, yaitu Llama 4 Scout, yang kecil dan bisa dijalankan di satu GPU Nvidia H100, dan Llama 4 Maverick, yang mirip dengan model GPT-4o dan Gemini 2.0 Flash. Meta juga sedang melatih model Llama 4 Behemoth, yang dikatakan oleh CEO Meta, Mark Zuckerberg, sebagai model dasar dengan performa tertinggi di dunia.

Llama 4 Scout memiliki kemampuan untuk mengingat hingga 10 juta token dan diklaim lebih baik daripada model-model lain seperti Google’s Gemini 3 dan Mistral 3.1 dalam berbagai pengujian. Model Maverick juga dikatakan memiliki performa yang sebanding dengan GPT-4o dan Gemini 2.0 Flash, tetapi menggunakan lebih sedikit parameter aktif. Sementara itu, Llama 4 Behemoth yang belum dirilis memiliki 288 miliar parameter aktif dan 2 triliun parameter total, dan diharapkan dapat mengungguli model lain dalam pengujian STEM.

Meta menggunakan arsitektur "mixture of experts" (MoE) untuk Llama 4, yang membantu menghemat sumber daya dengan hanya menggunakan bagian model yang diperlukan untuk tugas tertentu. Meskipun Meta menyebut Llama 4 sebagai "open-source," ada beberapa batasan dalam lisensinya, terutama bagi perusahaan besar yang harus meminta izin sebelum menggunakan model ini. Ini membuat beberapa orang berpendapat bahwa Llama 4 tidak sepenuhnya termasuk dalam kategori "Open Source."

Pertanyaan Terkait

Apa yang diumumkan oleh Meta baru-baru ini?

Meta mengumumkan koleksi model AI terbaru mereka, Llama 4.

Apa saja model yang termasuk dalam koleksi Llama 4?

Koleksi Llama 4 termasuk model Scout, Maverick, dan Behemoth.

Apa keunggulan Llama 4 Scout dibandingkan model lain?

Llama 4 Scout memiliki konteks window 10 juta token dan mengungguli model lain dalam berbagai benchmark.

Apa yang dimaksud dengan arsitektur 'mixture of experts'?

Arsitektur 'mixture of experts' adalah pendekatan yang menggunakan hanya bagian model yang diperlukan untuk tugas tertentu, sehingga menghemat sumber daya.

Apa yang direncanakan Meta untuk konferensi LlamaCon?

Meta merencanakan untuk membahas rencana masa depan untuk model dan produk AI di konferensi LlamaCon.

Rangkuman Berita: Meta merilis dua model AI Llama 4.

Pertanyaan Terkait

Rangkuman Berita Serupa