Anthropic menggunakan Pokémon untuk mengukur kinerja model AI terbarunya.
Courtesy of TechCrunch

Rangkuman Berita: Anthropic menggunakan Pokémon untuk mengukur kinerja model AI terbarunya.

TechCrunch
Dari TechCrunch
25 Februari 2025 pukul 02.10 WIB
46 dibaca
Share
Ikhtisar 15 Detik
  • Claude 3.7 Sonnet menunjukkan kemajuan signifikan dalam kemampuan AI untuk bermain game.
  • Penggunaan permainan klasik seperti Pokémon Red sebagai benchmark menunjukkan pendekatan inovatif dalam pengujian AI.
  • Anthropic terus berkomitmen untuk mengembangkan AI yang lebih aman dan efektif.
Anthropic baru-baru ini menguji model AI terbarunya, Claude 3.7 Sonnet, dengan menggunakan permainan klasik Game Boy, Pokémon Red. Mereka memberikan model ini kemampuan untuk mengingat, menerima input dari layar, dan menekan tombol untuk bermain Pokémon secara terus-menerus. Salah satu fitur unik dari Claude 3.7 Sonnet adalah kemampuannya untuk "berpikir lebih lama" dalam menyelesaikan masalah yang sulit, yang membantunya untuk berhasil mengalahkan tiga pemimpin gym Pokémon dan mendapatkan lencana mereka, sesuatu yang tidak bisa dilakukan oleh versi sebelumnya, Claude 3.0 Sonnet.
Meskipun Pokémon Red lebih dianggap sebagai alat pengujian yang sederhana, banyak permainan lain juga digunakan untuk menguji kemampuan AI. Dalam beberapa bulan terakhir, banyak aplikasi dan platform baru muncul untuk menguji kemampuan model AI dalam bermain berbagai permainan, mulai dari Street Fighter hingga Pictionary. Ini menunjukkan bahwa permainan bisa menjadi cara yang menarik untuk mengukur seberapa baik AI dapat berpikir dan beradaptasi.

Pertanyaan Terkait

Q
Apa yang diuji oleh Anthropic dalam model AI terbarunya?
A
Anthropic menguji model AI terbarunya, Claude 3.7 Sonnet, dengan permainan Pokémon Red.
Q
Apa yang membuat Claude 3.7 Sonnet berbeda dari versi sebelumnya?
A
Claude 3.7 Sonnet memiliki kemampuan berpikir yang lebih mendalam dan dapat menyelesaikan tantangan yang lebih kompleks dibandingkan dengan versi sebelumnya, Claude 3.0 Sonnet.
Q
Berapa banyak tindakan yang dilakukan Claude 3.7 Sonnet untuk mencapai gym leader terakhir?
A
Claude 3.7 Sonnet melakukan 35.000 tindakan untuk mencapai gym leader terakhir.
Q
Mengapa Pokémon Red dianggap sebagai benchmark untuk AI?
A
Pokémon Red dianggap sebagai benchmark untuk AI karena memiliki sejarah panjang dalam pengujian kemampuan bermain game oleh model AI.
Q
Apa tujuan utama dari pengembangan model AI oleh Anthropic?
A
Tujuan utama dari pengembangan model AI oleh Anthropic adalah untuk menciptakan kecerdasan buatan yang aman dan bermanfaat.

Rangkuman Berita Serupa

AI unggulan terbaru dari Anthropic mungkin tidak memerlukan biaya yang sangat tinggi untuk dilatih.TechCrunch
Teknologi
1 bulan lalu
88 dibaca
AI unggulan terbaru dari Anthropic mungkin tidak memerlukan biaya yang sangat tinggi untuk dilatih.
Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.TechCrunch
Teknologi
1 bulan lalu
103 dibaca
Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.
Anthropic Meluncurkan Model AI 'Penalaran Hibrida' Pertama di DuniaWired
Teknologi
1 bulan lalu
63 dibaca
Anthropic Meluncurkan Model AI 'Penalaran Hibrida' Pertama di Dunia
Model AI 'penalaran hibrida' baru dari Anthropic adalah yang terpandai hingga saat ini.TheVerge
Teknologi
1 bulan lalu
44 dibaca
Model AI 'penalaran hibrida' baru dari Anthropic adalah yang terpandai hingga saat ini.
Anthropic meluncurkan model AI baru yang 'berpikir' selama yang Anda inginkan.TechCrunch
Teknologi
1 bulan lalu
84 dibaca
Anthropic meluncurkan model AI baru yang 'berpikir' selama yang Anda inginkan.
Anthropic menambahkan penalaran canggih ke model terbarunya.Axios
Teknologi
1 bulan lalu
115 dibaca
Anthropic menambahkan penalaran canggih ke model terbarunya.