Minggu Ini dalam AI: Mungkin kita sebaiknya mengabaikan tolok ukur AI untuk saat ini.
Courtesy of TechCrunch

Rangkuman Berita: Minggu Ini dalam AI: Mungkin kita sebaiknya mengabaikan tolok ukur AI untuk saat ini.

TechCrunch
Dari TechCrunch
20 Februari 2025 pukul 01.35 WIB
73 dibaca
Share
Ikhtisar 15 Detik
  • Benchmark AI saat ini sering kali tidak mencerminkan kemampuan praktis model.
  • Ada kebutuhan mendesak untuk pengujian independen dan benchmark yang lebih baik dalam industri AI.
  • Startup baru seperti Thinking Machines Lab berusaha untuk membuat AI lebih sesuai dengan kebutuhan pengguna.
Minggu ini, Elon Musk meluncurkan model AI terbaru dari perusahaannya, xAI, yang bernama Grok 3. Model ini diklaim lebih baik daripada beberapa model AI terkemuka lainnya dalam hal matematika dan pemrograman. Namun, banyak ahli berpendapat bahwa hasil pengujian yang digunakan untuk menilai model AI sering kali tidak mencerminkan kemampuan sebenarnya dalam tugas-tugas yang penting bagi pengguna. Mereka meminta adanya pengujian yang lebih baik dan independen untuk menilai kinerja AI.
Selain itu, OpenAI mengubah pendekatan pengembangan AI-nya untuk lebih mendukung "kebebasan intelektual," dan ada juga startup baru bernama Thinking Machines Lab yang didirikan oleh mantan CTO OpenAI, Mira Murati. Meta juga akan mengadakan konferensi pengembang pertama yang fokus pada AI generatif, bernama LlamaCon, pada bulan April mendatang. Di sisi lain, sebuah perusahaan AI dari Tiongkok, Stepfun, meluncurkan model AI yang dapat memahami dan menghasilkan suara dalam beberapa bahasa, termasuk bahasa Mandarin, Inggris, dan Jepang.

Pertanyaan Terkait

Q
Apa yang dirilis oleh xAI minggu ini?
A
xAI merilis model AI terbarunya, Grok 3.
Q
Apa kritik yang disampaikan oleh Ethan Mollick mengenai benchmark AI?
A
Ethan Mollick mengkritik bahwa benchmark AI saat ini tidak cukup baik dan perlu ada pengujian independen.
Q
Siapa pendiri Thinking Machines Lab?
A
Thinking Machines Lab didirikan oleh Mira Murati, mantan CTO OpenAI.
Q
Apa tujuan dari OpenEuroLLM?
A
OpenEuroLLM bertujuan untuk membangun model dasar untuk AI yang transparan di Eropa.
Q
Apa yang dapat dilakukan oleh model Step-Audio?
A
Model Step-Audio dapat memahami dan menghasilkan ucapan dalam beberapa bahasa serta memungkinkan pengguna menyesuaikan emosi dan dialek.

Rangkuman Berita Serupa

Minggu Ini dalam AI: Para miliarder berbicara tentang mengotomatisasi pekerjaan.TechCrunch
Teknologi
2 bulan lalu
52 dibaca
Minggu Ini dalam AI: Para miliarder berbicara tentang mengotomatisasi pekerjaan.
Minggu Ini dalam AI: OpenAI mendapatkan keuntungan infrastruktur yang tak ternilai.TechCrunch
Teknologi
3 bulan lalu
89 dibaca
Minggu Ini dalam AI: OpenAI mendapatkan keuntungan infrastruktur yang tak ternilai.
Minggu Ini dalam AI: Apakah tindakan AI Biden akan bertahan di era Trump?TechCrunch
Teknologi
3 bulan lalu
90 dibaca
Minggu Ini dalam AI: Apakah tindakan AI Biden akan bertahan di era Trump?
Minggu Ini dalam AI: AI yang lebih canggih akan datang, tetapi apakah manfaatnya akan didistribusikan secara merata?TechCrunch
Teknologi
3 bulan lalu
157 dibaca
Minggu Ini dalam AI: AI yang lebih canggih akan datang, tetapi apakah manfaatnya akan didistribusikan secara merata?
Siapa yang menginginkan AI seperti 'Her' yang sering salah?TechCrunch
Teknologi
4 bulan lalu
130 dibaca
Siapa yang menginginkan AI seperti 'Her' yang sering salah?
Minggu Ini dalam AI: Mencari keseimbangan di tengah banjir beritaTechCrunch
Teknologi
4 bulan lalu
73 dibaca
Minggu Ini dalam AI: Mencari keseimbangan di tengah banjir berita