Courtesy of NatureMagazine
Ikhtisar 15 Detik
- Kemajuan model AI menunjukkan peningkatan yang signifikan dalam waktu penyelesaian tugas.
- Metrik baru yang dikembangkan oleh METR memberikan cara yang lebih baik untuk menilai kemajuan AI.
- Meskipun model AI semakin canggih, dampak ekonominya masih terbatas dan memerlukan lebih banyak eksperimen.
Sebuah organisasi non-profit bernama METR di Berkeley, California, telah mengembangkan metrik baru untuk menilai kemajuan model kecerdasan buatan (AI). Mereka menciptakan hampir 170 tugas nyata dalam bidang pemrograman, keamanan siber, dan pemikiran umum, lalu mengukur berapa lama waktu yang dibutuhkan oleh programmer ahli untuk menyelesaikannya. Metrik ini disebut 'horizon waktu penyelesaian tugas', yang menunjukkan seberapa cepat AI dapat menyelesaikan tugas dibandingkan dengan manusia. Hasil penelitian menunjukkan bahwa model AI terkemuka telah mengalami peningkatan pesat, dan diperkirakan bahwa pada tahun 2029, AI akan mampu menyelesaikan tugas yang biasanya memerlukan waktu sebulan bagi manusia dengan tingkat keberhasilan 50%.
Meskipun kemajuan AI sangat cepat, beberapa ahli mengingatkan bahwa prediksi ini mungkin tidak sepenuhnya akurat karena banyak faktor yang belum diketahui tentang bagaimana AI akan digunakan. Metrik baru ini membantu menjelaskan mengapa meskipun model AI terbaik sudah menunjukkan kinerja yang sangat baik, dampak ekonominya masih terbatas. Beberapa peneliti percaya bahwa jika organisasi lebih berani untuk bereksperimen dan berinvestasi dalam penggunaan AI, dampak ekonominya bisa lebih besar.
Pertanyaan Terkait
Q
Apa itu METR dan apa tujuannya?A
METR adalah organisasi nirlaba yang bertujuan untuk menilai kemajuan model AI melalui metrik yang dikembangkan.Q
Bagaimana cara METR mengukur kemajuan model AI?A
METR mengukur kemajuan model AI dengan menciptakan tugas dunia nyata dan membandingkan waktu penyelesaian dengan programmer manusia.Q
Apa yang ditemukan tentang GPT-2 dalam penelitian ini?A
Penelitian ini menemukan bahwa GPT-2 tidak mampu menyelesaikan tugas yang memerlukan waktu lebih dari satu menit.Q
Mengapa Joshua Gans skeptis terhadap prediksi kemajuan AI?A
Joshua Gans skeptis karena ia percaya bahwa prediksi kemajuan AI tidak selalu berarti karena banyak faktor yang belum dipahami.Q
Apa yang diharapkan METR untuk kemajuan model AI di masa depan?A
METR berharap bahwa model AI akan mampu menangani tugas yang memerlukan waktu sebulan bagi manusia pada tahun 2029.