Kontroversi Llama 4 Meta: Model AI Hebat tapi Ada yang Disembunyikan
Teknologi
Kecerdasan Buatan
08 Apr 2025
191 dibaca
1 menit

Rangkuman 15 Detik
Meta merilis model Llama 4 yang menantang model AI terkemuka lainnya.
Ada kekhawatiran tentang transparansi dan keadilan dalam pengujian model AI di LMArena.
Klaim tentang pelatihan pada set pengujian oleh Meta dibantah oleh VP AI Generatif mereka.
Meta merilis dua model AI baru, Scout dan Maverick, yang diklaim dapat mengalahkan model AI terkemuka lainnya. Namun, ditemukan bahwa versi Maverick yang diuji di LMArena adalah versi eksperimental yang dioptimalkan untuk percakapan, bukan versi yang tersedia untuk publik.
LMArena mengkritik Meta karena tidak menjelaskan bahwa model yang diuji adalah versi khusus, dan memperbarui kebijakan mereka untuk mencegah kebingungan di masa depan. Meta juga dituduh melatih modelnya untuk performa lebih baik di benchmark, meskipun mereka membantah tuduhan tersebut.
Perilisan Llama 4 oleh Meta juga dianggap aneh karena dilakukan pada akhir pekan dan setelah beberapa kali penundaan. Insiden ini menunjukkan bagaimana benchmark AI menjadi medan pertempuran dan pentingnya transparansi dalam perilisan model AI.
Analisis Ahli
Simon Willison
Menganggap skor tinggi Maverick di LMArena tidak berarti karena model yang diuji berbeda dengan versi publik, yang membuat peringkat tersebut kurang bisa dipercaya sebagai indikasi performa nyata.

