Seiring dengan semakin besar dan baiknya Model AI Generatif, keandalannya meluncur tajam ke jurang — atau mungkin itu hanya ilusi.
Courtesy of Forbes

Rangkuman Berita: Seiring dengan semakin besar dan baiknya Model AI Generatif, keandalannya meluncur tajam ke jurang — atau mungkin itu hanya ilusi.

Forbes
Dari Forbes
07 November 2024 pukul 04.40 WIB
95 dibaca
Share
Dalam artikel ini, penulis membahas tentang masalah keandalan AI generatif yang tampaknya menurun meskipun model AI semakin besar dan lebih baik. Penurunan keandalan ini mungkin disebabkan oleh cara pengukuran yang tidak tepat, di mana AI sering kali menghindari menjawab pertanyaan sulit, sehingga terlihat lebih baik daripada kenyataannya. Penulis menjelaskan bahwa keandalan AI berarti konsistensi dalam memberikan jawaban yang benar, dan jika AI sering memberikan jawaban yang salah, pengguna akan merasa frustrasi dan mungkin berhenti menggunakannya. Penulis juga mengilustrasikan masalah ini dengan contoh pengujian, di mana jika AI diizinkan untuk menghindari menjawab pertanyaan, hasilnya bisa tampak lebih baik. Namun, jika AI dipaksa untuk menjawab semua pertanyaan, kemungkinan jawaban yang salah akan meningkat. Ini menunjukkan bahwa cara kita mengukur keandalan AI sangat penting dan bisa mempengaruhi persepsi kita tentang seberapa baik AI sebenarnya. Penulis mengajak pembaca untuk berpikir kritis tentang bagaimana kita menilai kinerja AI dan pentingnya belajar dari kesalahan dalam pengukuran tersebut.

Rangkuman Berita Serupa

Orang-orang yang bermain-main dengan AI pendeteksi emosi dengan berpura-pura menunjukkan reaksi emosional dapat menyebabkan kebiasaan emosional masyarakat yang luas dan histeria.Forbes
Teknologi
3 bulan lalu
149 dibaca
Orang-orang yang bermain-main dengan AI pendeteksi emosi dengan berpura-pura menunjukkan reaksi emosional dapat menyebabkan kebiasaan emosional masyarakat yang luas dan histeria.
LLM memiliki dua wajah dengan berpura-pura mematuhi keselarasan AI yang dijunjung tinggi, tetapi kemudian berubah menjadi pengkhianat tanpa jiwa.Forbes
Teknologi
3 bulan lalu
106 dibaca
LLM memiliki dua wajah dengan berpura-pura mematuhi keselarasan AI yang dijunjung tinggi, tetapi kemudian berubah menjadi pengkhianat tanpa jiwa.
ChatGPT o3 dari OpenAI yang dipimpin oleh Sam Altman sedang bertaruh besar pada penyelarasan deliberatif untuk menjaga AI tetap dalam batasan dan tidak beracun.Forbes
Teknologi
4 bulan lalu
157 dibaca
ChatGPT o3 dari OpenAI yang dipimpin oleh Sam Altman sedang bertaruh besar pada penyelarasan deliberatif untuk menjaga AI tetap dalam batasan dan tidak beracun.
Rantai Pemikiran Berkelanjutan Menjanjikan Peningkatan Besar untuk LLM dan AI Generatif dengan Menghancurkan Fokus pada TokenForbes
Teknologi
4 bulan lalu
46 dibaca
Rantai Pemikiran Berkelanjutan Menjanjikan Peningkatan Besar untuk LLM dan AI Generatif dengan Menghancurkan Fokus pada Token
Kecerdikan Licik di Batas Antara AI Versus AGI dan Akhirnya Kecerdasan Super AIForbes
Teknologi
4 bulan lalu
73 dibaca
Kecerdikan Licik di Batas Antara AI Versus AGI dan Akhirnya Kecerdasan Super AI
Sam Altman Mengungkapkan Kekurangan Sebelumnya Dalam AI Canggih OpenAI o1 Selama Pengumuman ChatGPT Pro, Namun Tidak Ada yang Tampak Menyadarinya Secara Luas.Forbes
Teknologi
4 bulan lalu
151 dibaca
Sam Altman Mengungkapkan Kekurangan Sebelumnya Dalam AI Canggih OpenAI o1 Selama Pengumuman ChatGPT Pro, Namun Tidak Ada yang Tampak Menyadarinya Secara Luas.
Pendekatan Perlindungan AI Hibrida Amazon Mendorong Permintaan Pemeriksaan Aturan yang Menangkap Halusinasi AI dan Menjaga LLM Tetap JujurForbes
Teknologi
4 bulan lalu
87 dibaca
Pendekatan Perlindungan AI Hibrida Amazon Mendorong Permintaan Pemeriksaan Aturan yang Menangkap Halusinasi AI dan Menjaga LLM Tetap Jujur