Organisasi pengukuran AI dikritik karena menunggu untuk mengungkapkan pendanaan dari OpenAI.
Courtesy of TechCrunch

Rangkuman Berita: Organisasi pengukuran AI dikritik karena menunggu untuk mengungkapkan pendanaan dari OpenAI.

TechCrunch
DariĀ TechCrunch
20 Januari 2025 pukul 02.58 WIB
108 dibaca
Share
Sebuah organisasi bernama Epoch AI yang mengembangkan tolok ukur matematika untuk kecerdasan buatan (AI) baru-baru ini mengungkapkan bahwa mereka menerima dana dari OpenAI. Hal ini menimbulkan tuduhan ketidakberesan dari beberapa anggota komunitas AI karena banyak kontributor untuk tolok ukur yang disebut FrontierMath tidak diberitahu tentang keterlibatan OpenAI hingga informasi tersebut dipublikasikan. FrontierMath dirancang untuk mengukur kemampuan matematika AI dan digunakan oleh OpenAI untuk mendemonstrasikan AI terbaru mereka, o3. Beberapa pengguna media sosial khawatir bahwa kerahasiaan ini dapat merusak reputasi FrontierMath sebagai tolok ukur yang objektif.
Tamay Besiroglu, salah satu pendiri Epoch AI, mengakui bahwa mereka seharusnya lebih transparan mengenai keterlibatan OpenAI. Meskipun OpenAI memiliki akses ke FrontierMath, mereka memiliki kesepakatan lisan untuk tidak menggunakan soal-soal dari FrontierMath untuk melatih AI mereka. Namun, ada kekhawatiran dari matematikawan Epoch AI bahwa mereka belum dapat memverifikasi hasil yang diumumkan oleh OpenAI. Situasi ini menunjukkan tantangan dalam mengembangkan tolok ukur yang dapat diandalkan untuk mengevaluasi AI tanpa menimbulkan kesan konflik kepentingan.

Pertanyaan Terkait

Q
Apa itu Epoch AI dan apa tujuan mereka?
A
Epoch AI adalah organisasi nirlaba yang mengembangkan tolok ukur matematika untuk kecerdasan buatan dengan tujuan untuk meningkatkan evaluasi kemampuan AI.
Q
Mengapa keterlibatan OpenAI dalam FrontierMath menjadi kontroversial?
A
Keterlibatan OpenAI dalam FrontierMath menjadi kontroversial karena mereka tidak mengungkapkan pendanaan tersebut kepada banyak kontributor hingga baru-baru ini, yang menimbulkan tuduhan kurangnya transparansi.
Q
Apa yang diungkapkan Tamay Besiroglu tentang transparansi?
A
Tamay Besiroglu mengakui bahwa Epoch AI melakukan kesalahan dalam hal transparansi dan seharusnya lebih terbuka tentang pendanaan dari OpenAI kepada kontributor.
Q
Bagaimana Ellot Glazer menilai hasil yang diberikan oleh OpenAI?
A
Ellot Glazer percaya bahwa hasil yang diberikan oleh OpenAI adalah sah, tetapi menekankan bahwa mereka tidak dapat memverifikasi hasil tersebut secara independen.
Q
Apa tantangan yang dihadapi dalam mengembangkan tolok ukur untuk AI?
A
Tantangan dalam mengembangkan tolok ukur untuk AI termasuk memastikan integritas dan transparansi dalam pendanaan serta menghindari persepsi konflik kepentingan.

Rangkuman Berita Serupa

OpenAI Luncurkan Program Baru untuk Perbaiki Tolok Ukur AITechCrunch
Teknologi
14 hari lalu
42 dibaca
OpenAI Luncurkan Program Baru untuk Perbaiki Tolok Ukur AI
Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan MaverickTheVerge
Teknologi
16 hari lalu
86 dibaca
Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick
Peneliti menyarankan OpenAI melatih model AI pada buku O'Reilly yang terbayar.TechCrunch
Teknologi
22 hari lalu
70 dibaca
Peneliti menyarankan OpenAI melatih model AI pada buku O'Reilly yang terbayar.
OpenAI research lead Noam Brown berpikir model 'penalaran' AI bisa saja muncul beberapa dekade yang lalu.TechCrunch
Teknologi
1 bulan lalu
113 dibaca
OpenAI research lead Noam Brown berpikir model 'penalaran' AI bisa saja muncul beberapa dekade yang lalu.
Apakah xAI berbohong tentang benchmark Grok 3?TechCrunch
Teknologi
2 bulan lalu
130 dibaca
Apakah xAI berbohong tentang benchmark Grok 3?
OpenAI menggunakan subreddit ini untuk menguji persuasi AI.TechCrunch
Teknologi
2 bulan lalu
48 dibaca
OpenAI menggunakan subreddit ini untuk menguji persuasi AI.
Bagaimana DeepSeek mengubah lanskap AI di Silicon ValleyTechCrunch
Teknologi
2 bulan lalu
101 dibaca
Bagaimana DeepSeek mengubah lanskap AI di Silicon Valley