FrontierMath adalah tes yang dirancang untuk mengukur keterampilan matematika kecerdasan buatan dengan masalah tingkat ahli. Tes ini digunakan oleh OpenAI untuk mendemonstrasikan kemampuan AI flagship mereka, o3.
Sains
3 bulan lalu
Organisasi pengukuran AI dikritik karena menunggu untuk mengungkapkan pendanaan dari OpenAI.
Tentang Halaman Ini
FrontierMath adalah tes yang dirancang untuk mengukur keterampilan matematika kecerdasan buatan dengan masalah tingkat ahli. Tes ini digunakan oleh OpenAI untuk mendemonstrasikan kemampuan AI flagship mereka, o3.