Rangkuman berita: Anthropic menggunakan Pokémon untuk mengukur kinerja model AI terbarunya.

Anthropic baru-baru ini menguji model AI terbarunya, Claude 3.7 Sonnet, dengan menggunakan permainan klasik Game Boy, Pokémon Red. Mereka memberikan model ini kemampuan untuk mengingat, menerima input dari layar, dan menekan tombol untuk bermain Pokémon secara terus-menerus. Salah satu fitur unik dari Claude 3.7 Sonnet adalah kemampuannya untuk "berpikir lebih lama" dalam menyelesaikan masalah yang sulit, yang membantunya untuk berhasil mengalahkan tiga pemimpin gym Pokémon dan mendapatkan lencana mereka, sesuatu yang tidak bisa dilakukan oleh versi sebelumnya, Claude 3.0 Sonnet.

Meskipun Pokémon Red lebih dianggap sebagai alat pengujian yang sederhana, banyak permainan lain juga digunakan untuk menguji kemampuan AI. Dalam beberapa bulan terakhir, banyak aplikasi dan platform baru muncul untuk menguji kemampuan model AI dalam bermain berbagai permainan, mulai dari Street Fighter hingga Pictionary. Ini menunjukkan bahwa permainan bisa menjadi cara yang menarik untuk mengukur seberapa baik AI dapat berpikir dan beradaptasi.

Pertanyaan Terkait

Apa yang diuji oleh Anthropic dalam model AI terbarunya?

Anthropic menguji model AI terbarunya, Claude 3.7 Sonnet, dengan permainan Pokémon Red.

Apa yang membuat Claude 3.7 Sonnet berbeda dari versi sebelumnya?

Claude 3.7 Sonnet memiliki kemampuan berpikir yang lebih mendalam dan dapat menyelesaikan tantangan yang lebih kompleks dibandingkan dengan versi sebelumnya, Claude 3.0 Sonnet.

Berapa banyak tindakan yang dilakukan Claude 3.7 Sonnet untuk mencapai gym leader terakhir?

Claude 3.7 Sonnet melakukan 35.000 tindakan untuk mencapai gym leader terakhir.

Mengapa Pokémon Red dianggap sebagai benchmark untuk AI?

Pokémon Red dianggap sebagai benchmark untuk AI karena memiliki sejarah panjang dalam pengujian kemampuan bermain game oleh model AI.

Apa tujuan utama dari pengembangan model AI oleh Anthropic?

Tujuan utama dari pengembangan model AI oleh Anthropic adalah untuk menciptakan kecerdasan buatan yang aman dan bermanfaat.

Rangkuman Berita: Anthropic menggunakan Pokémon untuk mengukur kinerja model AI terbarunya.

Pertanyaan Terkait

Rangkuman Berita Serupa