AI summary
DeepMind dan OpenAI berhasil mencapai skor medali emas di Olimpiade Matematika Internasional dengan menggunakan model bahasa besar. Metode baru yang digunakan oleh DeepMind memungkinkan pemrosesan bahasa alami tanpa campur tangan manusia. Terdapat harapan bahwa pendekatan berbeda dalam AI dapat berkembang bersama dan saling melengkapi di masa depan. DeepMind dan OpenAI membuat terobosan dengan mengembangkan AI yang dapat menyelesaikan soal matematika Olympiad tingkat tinggi, bersaing dengan pelajar terbaik dunia. Ini merupakan pencapaian signifikan dalam aplikasi kecerdasan buatan di bidang pendidikan dan pemecahan masalah kompleks.Sebelumnya, AI matematika memerlukan penerjemahan soal dari bahasa manusia ke bentuk kode dan penerjemahan kembali jawaban agar manusia dapat memahaminya. Tahun ini, DeepMind memperkenalkan model DeepThink yang mampu melakukan semuanya secara otomatis dan dalam bahasa alami.DeepThink berhasil mendapatkan skor yang setara dengan medali emas di Olimpiade Matematika Internasional 2024, yakni 35 dari 42 poin, dengan penilaian dilakukan oleh juri yang sama dengan juri manusia. Ini menunjukkan kemampuan AI yang semakin mendekati kecerdasan manusia dalam matematika.OpenAI juga menguji model bahasa besarnya dalam menyelesaikan soal yang sama, dengan hasil setara medali emas. Perbandingan antara pendekatan neural network yang belajar dari data besar dengan metode neurosymbolic yang mengandalkan logika terprogram manual masih menjadi perdebatan di kalangan ilmuwan AI.Para ahli menyambut baik kemajuan ini, meski beberapa tetap mendukung metode logika yang dikodekan tangan. Masa depan kecerdasan buatan matematis mungkin akan melihat gabungan antara jaringan saraf besar dan aturan logika simbolik untuk hasil yang lebih optimal.
Kemampuan DeepThink yang memecahkan soal IMO secara natural language adalah tonggak besar karena mengurangi ketergantungan pada penerjemah manusia dan mempercepat solusi matematika kompleks. Namun, kita harus tetap skeptis karena matematika tingkat tinggi juga membutuhkan pemahaman mendalam yang mungkin belum sempurna dimiliki oleh LLM saat ini.