AI DeepSeekMath-V2 Kalahkan Manusia dalam Kompetisi Matematika Bergengsi
Sains
Matematika
04 Des 2025
276 dibaca
2 menit

Rangkuman 15 Detik
DeepSeekMath-V2 menunjukkan kemajuan signifikan dalam kecerdasan buatan di bidang matematika.
Model ini memperkenalkan konsep verifikasi diri yang meningkatkan keandalan dalam penalaran matematis.
Persaingan antara berbagai model AI seperti DeepSeek dan Gemini menunjukkan potensi besar AI dalam menyelesaikan masalah kompleks.
Sebuah perusahaan kecerdasan buatan asal Tiongkok, DeepSeek, telah mengembangkan model matematika bernama DeepSeekMath-V2 yang mampu mengidentifikasi dan memperbaiki kesalahan sendiri dalam proses penalaran matematis. Kehebatan model ini ditunjukkan saat mereka berhasil mengalahkan skor manusia terbaik dalam kompetisi matematika mahasiswa paling bergengsi di dunia, yaitu William Lowell Putnam Competition 2024.
Model DeepSeekMath-V2 mencatat skor luar biasa yaitu 118 poin dari maksimal 120, mengungguli skor manusia terbaik yang hanya mencapai 90 poin. Model ini juga menunjukkan kemampuan setara pemenang medali emas di Olimpiade Matematika Internasional 2025 dan Olimpiade Matematika China 2024, membuktikan kecanggihan AI dalam bidang matematika tingkat tinggi.
Keunggulan model ini terletak pada mekanismenya yang tidak hanya mengevaluasi benar atau salahnya jawaban, tetapi juga kemampuan untuk memeriksa dan memperbaiki setiap langkah argumentasi matematis secara mandiri menggunakan sistem self-verification. Hal ini memungkinkan AI untuk membangun bukti matematis yang lebih terpercaya dan tidak rawan kesalahan.
Sistem ini melibatkan tiga komponen utama, yaitu generator bukti yang menyusun solusi, verifier yang menilai kualitas bukti, dan meta-verifier yang meninjau ulang kritik dari verifier guna menghindari kesalahan. Ketiga bagian ini bekerja secara siklis membentuk umpan balik yang meningkatkan kemampuan AI dalam memecahkan masalah matematika.
Meskipun demikian, model ini belum berhasil memecahkan soal matematika paling sulit di kompetisi Olimpiade Matematika Internasional, sehingga riset ke depan masih dibutuhkan. Metode ini berbeda dengan pendekatan lain seperti Gemini’s Deep Think yang memakai bahasa simbolik Lean, yang lebih tepat dan minim kesalahan tapi memerlukan sumber daya besar dan bantuan ahli.
Analisis Ahli
Kevin Buzzard
AI sudah mencapai level mahasiswa pintar dan kemajuan ini sangat menggembirakan bagi bidang matematika dan komputasi.

