Uji AGI baru yang menantang membuat kebanyakan model AI kebingungan.
Courtesy of TechCrunch

Rangkuman Berita: Uji AGI baru yang menantang membuat kebanyakan model AI kebingungan.

TechCrunch
Dari TechCrunch
25 Maret 2025 pukul 07.29 WIB
103 dibaca
Share
Ikhtisar 15 Detik
  • ARC-AGI-2 adalah tes baru yang lebih menantang untuk mengukur kecerdasan umum model AI.
  • Efisiensi dalam menyelesaikan masalah menjadi fokus utama dalam pengujian ARC-AGI-2.
  • Arc Prize Foundation mengadakan kompetisi untuk mendorong pengembang mencapai hasil yang lebih baik dengan biaya yang lebih rendah.
Yayasan Arc Prize, yang didirikan oleh peneliti AI terkenal François Chollet, baru saja mengumumkan tes baru bernama ARC-AGI-2 untuk mengukur kecerdasan umum model AI. Tes ini terdiri dari masalah seperti teka-teki di mana AI harus mengidentifikasi pola visual dari kotak berwarna dan menghasilkan grid jawaban yang benar. Hasilnya menunjukkan bahwa sebagian besar model AI, termasuk yang terkenal seperti GPT-4.5 dan Claude 3.7, hanya mendapatkan skor sekitar 1%, jauh di bawah rata-rata manusia yang mencapai 60%.
ARC-AGI-2 dirancang untuk menguji seberapa efisien AI dapat belajar dan menyelesaikan masalah baru tanpa mengandalkan kekuatan komputasi yang besar. Chollet menjelaskan bahwa kecerdasan tidak hanya diukur dari kemampuan menyelesaikan masalah, tetapi juga seberapa efisien AI dapat belajar dan menerapkan keterampilan tersebut. Bersamaan dengan tes ini, Yayasan Arc Prize juga mengumumkan kontes Arc Prize 2025, yang menantang pengembang untuk mencapai akurasi 85% pada tes ARC-AGI-2 dengan biaya hanya Rp 690.69 ribu ($0,42) per tugas.

Pertanyaan Terkait

Q
Apa itu ARC-AGI-2?
A
ARC-AGI-2 adalah tes baru yang dirancang untuk mengukur kecerdasan umum model AI.
Q
Siapa yang mendirikan Arc Prize Foundation?
A
Arc Prize Foundation didirikan oleh François Chollet dan rekan-rekannya.
Q
Bagaimana cara ARC-AGI-2 mengukur kecerdasan model AI?
A
ARC-AGI-2 mengukur kecerdasan model AI dengan menguji kemampuan mereka dalam menyelesaikan masalah baru dan efisiensi dalam melakukannya.
Q
Apa yang menjadi kelemahan dari ARC-AGI-1?
A
Kelemahan ARC-AGI-1 adalah model AI dapat mengandalkan kekuatan komputasi yang besar untuk menemukan solusi.
Q
Apa tujuan dari Arc Prize 2025?
A
Tujuan dari Arc Prize 2025 adalah menantang pengembang untuk mencapai akurasi 85% pada tes ARC-AGI-2 dengan biaya rendah.

Rangkuman Berita Serupa

Anthropic Meluncurkan Model AI 'Penalaran Hibrida' Pertama di DuniaWired
Teknologi
2 bulan lalu
65 dibaca

Anthropic Meluncurkan Model AI 'Penalaran Hibrida' Pertama di Dunia

Orang-orang sedang melakukan pengukuran terhadap AI dengan memintanya untuk membuat bola memantul dalam bentuk yang berputar.TechCrunch
Teknologi
3 bulan lalu
78 dibaca

Orang-orang sedang melakukan pengukuran terhadap AI dengan memintanya untuk membuat bola memantul dalam bentuk yang berputar.

Bagaimana seharusnya kita menguji AI untuk kecerdasan setara manusia? o3 dari OpenAI menghidupkan pencarian ini.NatureMagazine
Teknologi
3 bulan lalu
105 dibaca

Bagaimana seharusnya kita menguji AI untuk kecerdasan setara manusia? o3 dari OpenAI menghidupkan pencarian ini.

Peneliti AI François Chollet sedang mendirikan sebuah organisasi nirlaba untuk membangun tolok ukur bagi AGI.TechCrunch
Teknologi
3 bulan lalu
70 dibaca

Peneliti AI François Chollet sedang mendirikan sebuah organisasi nirlaba untuk membangun tolok ukur bagi AGI.

Apakah Anda akan mempercayakan Kecerdasan Umum Non-Manusia tanpa Integritas?Forbes
Teknologi
3 bulan lalu
113 dibaca

Apakah Anda akan mempercayakan Kecerdasan Umum Non-Manusia tanpa Integritas?

Melihat Kemampuan Terobosan Dengan OpenAI O3Forbes
Teknologi
4 bulan lalu
88 dibaca

Melihat Kemampuan Terobosan Dengan OpenAI O3