AI Masih Sulit Gantikan Pekerjaan Kantoran Kompleks, Ini Sebabnya
Courtesy of TechCrunch

AI Masih Sulit Gantikan Pekerjaan Kantoran Kompleks, Ini Sebabnya

Mengetahui kemampuan model AI terkini dalam mengeksekusi tugas-tugas kerja pengetahuan nyata di bidang konsultasi, hukum, dan perbankan investasi, serta memahami tantangan utama yang menghambat otomasi pekerjaan-pekerjaan tersebut.

23 Jan 2026, 04.42 WIB
230 dibaca
Share
Ikhtisar 15 Detik
  • Model AI saat ini belum siap untuk menggantikan pekerjaan pengetahuan secara efektif.
  • Benchmark APEX-Agents memberikan pemahaman yang lebih baik tentang kemampuan model AI dalam konteks pekerjaan profesional.
  • Meskipun hasilnya masih rendah, perkembangan model AI menunjukkan potensi perbaikan yang cepat dalam kemampuan mereka.
tidak disebutkan secara eksplisit - Sudah hampir dua tahun sejak CEO Microsoft, Satya Nadella, memprediksi bahwa AI akan menggantikan pekerjaan pengetahuan seperti pengacara, bankir investasi, dan beberapa profesi white-collar lainnya. Namun, meskipun teknologi AI berkembang pesat, perubahan besar di dunia kerja pengetahuan ini masih belum terlihat. Penelitian terbaru dari perusahaan pelatihan data Mercor memberikan wawasan baru tentang alasan di balik hal tersebut.
Penelitian tersebut menghasilkan sebuah tolok ukur bernama APEX-Agents yang berisi serangkaian tugas nyata dari profesi profesional seperti konsultasi, perbankan investasi, dan hukum. Dalam pengujian ini, hampir semua model AI gagal mencapai hasil yang memuaskan, dengan tingkat jawaban benar hanya sekitar 25%. Sebagian besar pertanyaan dijawab salah atau tidak dijawab sama sekali.
Salah satu tantangan terbesar yang ditemukan adalah kemampuan model untuk mengelola informasi dari berbagai platform dan domain sekaligus, seperti Slack, Google Drive, dan lain-lain. Hal ini sangat penting dalam pekerjaan manusia di bidang-bidang tersebut, karena jarang ada konteks lengkap dalam satu sumber saja. Keterbatasan ini menjadi hambatan utama bagi AI dalam menyelesaikan tugas-tugas kompleks tersebut.
Meski begitu, perkembangan AI masih terus berlangsung dengan cepat. Model seperti Gemini 3 Flash dan GPT-5.2 menunjukkan kemajuan terbaik dalam ujian tersebut, meskipun tetap jauh dari sempurna. Brendan Foody dari Mercor percaya bahwa peningkatan kemampuan AI dari tahun ke tahun menjanjikan perkembangan lebih cepat di masa depan, sehingga otomatisasi pekerjaan pengetahuan bisa menjadi kenyataan.
Perbedaan utama antara APEX-Agents dan tolok ukur lain seperti GDPval adalah fokus pada kemampuan AI untuk menangani tugas yang berkelanjutan dalam bidang profesional tertentu, bukan hanya pengetahuan umum. Hal ini membuat benchmark baru ini lebih relevan untuk mengukur potensi penggantian pekerjaan profesional oleh AI, dan membuka tantangan baru bagi para pengembang AI di seluruh dunia.
Referensi:
[1] https://techcrunch.com/2026/01/22/are-ai-agents-ready-for-the-workplace-a-new-benchmark-raises-doubts/

Analisis Ahli

Brendan Foody
"Benchmark ini mencerminkan bagaimana pekerjaan profesional dilakukan secara nyata dan menantang kemampuan AI dalam multi-domain reasoning, yang merupakan kunci utama dalam otomatisasi pekerjaan pengetahuan."

Analisis Kami

"Meskipun hype AI cukup tinggi, kenyataannya adalah model saat ini belum mampu mengelola kompleksitas pekerjaan white-collar yang butuh integrasi informasi dari banyak sumber. Namun, peningkatan yang stabil dan terbukanya benchmark realistis seperti APEX-Agents memberi tanda positif bahwa revolusi otomasi pekerjaan pengetahuan mungkin benar-benar datang dalam waktu yang tidak lama."

Prediksi Kami

Dalam beberapa tahun ke depan, model AI akan terus meningkat kemampuannya dalam menangani tugas kerja pengetahuan yang kompleks, berpotensi mampu menggantikan pekerja white-collar tingkat entry-level atau intern dalam waktu dekat.

Pertanyaan Terkait

Q
Apa yang diprediksi oleh Satya Nadella mengenai AI dan pekerjaan pengetahuan?
A
Satya Nadella memprediksi bahwa AI akan menggantikan banyak pekerjaan pengetahuan yang dilakukan oleh pekerja kantoran.
Q
Apa itu APEX-Agents dan mengapa penting?
A
APEX-Agents adalah benchmark baru yang mengukur kemampuan model AI dalam menyelesaikan tugas pekerjaan pengetahuan yang kompleks dan penting.
Q
Siapa yang melakukan penelitian tentang kinerja model AI dalam pekerjaan pengetahuan?
A
Penelitian tentang kinerja model AI dilakukan oleh perusahaan Mercor.
Q
Model AI mana yang memiliki kinerja terbaik dalam benchmark APEX-Agents?
A
Gemini 3 Flash memiliki kinerja terbaik dengan akurasi 24% dalam benchmark APEX-Agents.
Q
Mengapa model AI kesulitan dalam tugas pekerjaan pengetahuan?
A
Model AI kesulitan dalam melacak informasi di berbagai domain yang berbeda, yang merupakan aspek penting dari pekerjaan pengetahuan.