AI summary
GPT-5 menunjukkan kemajuan dalam mengurangi hallusinasi dan kutipan palsu. Model ini masih menghadapi tantangan dalam bidang teknis seperti hukum dan matematika. Akses internet meningkatkan akurasi GPT-5 dalam memberikan informasi yang relevan. Model kecerdasan buatan seperti GPT kerap menghasilkan informasi yang salah dan kutipan palsu. Ini disebut halusinasi, yang terjadi karena cara kerja AI yang memprediksi kata berdasarkan pola data sebelumnya tanpa menjamin kebenaran. OpenAI baru-baru ini meluncurkan GPT-5 yang dirancang untuk mengurangi kesalahan ini, berbeda dengan tren model AI lain yang justru lebih sering berhalusinasi.Dalam pengujian dengan benchmark ScholarQA-CS, GPT-5 menunjukkan performa mendekati manusia saat diberi akses internet untuk memverifikasi jawaban. Model ini juga lebih jujur dengan lebih jarang mengklaim telah menyelesaikan tugas yang faktanya mustahil. Namun, di bidang seperti matematika dan hukum, GPT-5 masih menghadapi hambatan besar, terutama saat offline.OpenAI mengakui bahwa halusinasi tidak bisa dihilangkan sepenuhnya karena model ini hanya melakukan generalisasi statistik. Namun tim mereka membuat kemajuan dengan membesarkan model, memperbanyak data pelatihan, dan melatih AI untuk berkata jujur bila tidak tahu jawaban. Meski begitu, kesalahan tetap muncul dan pengguna harus menyikapinya dengan hati-hati.Selain GPT-5, ada kompetitor lain seperti Google Gemini 2.0 yang sedikit lebih unggul dalam beberapa pengujian terkait halusinasi dan keakuratan. Namun secara umum, model-model ini sudah jauh membaik dibanding versi sebelumnya. Kunci keberhasilan adalah kemampuan AI untuk browsing dan memastikan sumber data terpercaya saat menjawab pertanyaan terbuka.Perkembangan GPT-5 menunjukkan AI semakin bisa diandalkan untuk tugas-tugas kompleks seperti review literatur ilmiah. Meski begitu, para ahli mengingatkan bahwa pengguna harus terus kritis karena AI masih bisa membuat kesalahan dan kadang tidak mengakui keterbatasannya. Masa depan AI akan fokus pada pengurangan kesalahan dan peningkatan kejujuran dalam interaksi manusia.
Penurunan halusinasi di GPT-5 menunjukkan kemajuan signifikan dalam desain model AI, tetapi kegagalan dalam tugas sederhana menandakan masih adanya batasan fundamental pada pendekatan statistik. OpenAI harus menggabungkan metode yang memungkinkan AI untuk rutin mengaku tidak tahu agar kepercayaan pengguna tidak terganggu.