
Baru-baru ini, Mercor meluncurkan sebuah tolok ukur baru yang dirancang untuk menguji kemampuan AI dalam menyelesaikan tugas-tugas profesional seperti hukum dan analisis korporasi. Pada awalnya, hasil dari berbagai laboratorium besar menunjukkan skor yang sangat rendah, yaitu kurang dari 25%, yang menandakan bahwa AI masih jauh dari mampu menggantikan peran manusia di bidang ini.
Namun, dalam beberapa minggu terakhir terjadi kemajuan signifikan di bidang AI. Anthropic, sebuah perusahaan pengembang AI, mengeluarkan model baru bernama Opus 4.6 yang berhasil meningkatkan skor kinerja mereka mendekati 30% dalam pengujian satu kali percobaan. Selain itu, dengan memberikan beberapa kesempatan lebih, skor rata-rata yang dicapai bahkan mencapai 45%.
Salah satu faktor utama meningkatkan kemampuan model baru ini adalah penambahan fitur agentic seperti “agent swarms,” yang memungkinkan AI bekerja dalam bentuk kelompok untuk menyelesaikan masalah multistep dengan lebih efektif dan efisien. Ini menunjukkan kemajuan bukan hanya dalam kemampuan dasar, tetapi juga dalam strategi pemecahan masalah AI.
Meskipun skor terbaru ini merupakan lompatan besar dari standar sebelumnya, yaitu dari sekitar 18,4% ke hampir 30%, masih jauh dari sempurna dan belum otomatis mengancam posisi para profesional hukum dalam waktu dekat. Namun, hal ini merupakan sinyal bahwa perubahan besar di bidang ini bisa terjadi cepat dan para praktisi hukum harus lebih waspada dari sebelumnya.
Brendan Foody, CEO Mercor, memberikan komentar tentang kemajuan ini dengan mengatakan bahwa lonjakan sebesar ini dalam beberapa bulan adalah luar biasa dan menandakan bahwa perkembangan teknologi AI tidak akan melambat dalam waktu dekat. Dengan demikian, masa depan kerja di sektor profesional seperti hukum harus mulai memikirkan bagaimana beradaptasi dengan kemajuan AI yang pesat.