Courtesy of Forbes

Teknologi |Kecerdasan Buatan

Rangkuman Berita: Seiring dengan semakin besar dan baiknya Model AI Generatif, keandalannya meluncur tajam ke jurang — atau mungkin itu hanya ilusi.

Dari Forbes

07 November 2024 pukul 04.40 WIB

95 dibaca

Dalam artikel ini, penulis membahas tentang masalah keandalan AI generatif yang tampaknya menurun meskipun model AI semakin besar dan lebih baik. Penurunan keandalan ini mungkin disebabkan oleh cara pengukuran yang tidak tepat, di mana AI sering kali menghindari menjawab pertanyaan sulit, sehingga terlihat lebih baik daripada kenyataannya. Penulis menjelaskan bahwa keandalan AI berarti konsistensi dalam memberikan jawaban yang benar, dan jika AI sering memberikan jawaban yang salah, pengguna akan merasa frustrasi dan mungkin berhenti menggunakannya. Penulis juga mengilustrasikan masalah ini dengan contoh pengujian, di mana jika AI diizinkan untuk menghindari menjawab pertanyaan, hasilnya bisa tampak lebih baik. Namun, jika AI dipaksa untuk menjawab semua pertanyaan, kemungkinan jawaban yang salah akan meningkat. Ini menunjukkan bahwa cara kita mengukur keandalan AI sangat penting dan bisa mempengaruhi persepsi kita tentang seberapa baik AI sebenarnya. Penulis mengajak pembaca untuk berpikir kritis tentang bagaimana kita menilai kinerja AI dan pentingnya belajar dari kesalahan dalam pengukuran tersebut.

Rangkuman Berita Serupa

Orang-orang yang bermain-main dengan AI pendeteksi emosi dengan berpura-pura menunjukkan reaksi emosional dapat menyebabkan kebiasaan emosional masyarakat yang luas dan histeria.

Orang-orang yang bermain-main dengan AI pendeteksi emosi dengan berpura-pura menunjukkan reaksi emosional dapat menyebabkan kebiasaan emosional masyarakat yang luas dan histeria.

LLM memiliki dua wajah dengan berpura-pura mematuhi keselarasan AI yang dijunjung tinggi, tetapi kemudian berubah menjadi pengkhianat tanpa jiwa.

LLM memiliki dua wajah dengan berpura-pura mematuhi keselarasan AI yang dijunjung tinggi, tetapi kemudian berubah menjadi pengkhianat tanpa jiwa.

ChatGPT o3 dari OpenAI yang dipimpin oleh Sam Altman sedang bertaruh besar pada penyelarasan deliberatif untuk menjaga AI tetap dalam batasan dan tidak beracun.

ChatGPT o3 dari OpenAI yang dipimpin oleh Sam Altman sedang bertaruh besar pada penyelarasan deliberatif untuk menjaga AI tetap dalam batasan dan tidak beracun.

Rantai Pemikiran Berkelanjutan Menjanjikan Peningkatan Besar untuk LLM dan AI Generatif dengan Menghancurkan Fokus pada Token

Rantai Pemikiran Berkelanjutan Menjanjikan Peningkatan Besar untuk LLM dan AI Generatif dengan Menghancurkan Fokus pada Token

Kecerdikan Licik di Batas Antara AI Versus AGI dan Akhirnya Kecerdasan Super AI

Kecerdikan Licik di Batas Antara AI Versus AGI dan Akhirnya Kecerdasan Super AI

Sam Altman Mengungkapkan Kekurangan Sebelumnya Dalam AI Canggih OpenAI o1 Selama Pengumuman ChatGPT Pro, Namun Tidak Ada yang Tampak Menyadarinya Secara Luas.

Sam Altman Mengungkapkan Kekurangan Sebelumnya Dalam AI Canggih OpenAI o1 Selama Pengumuman ChatGPT Pro, Namun Tidak Ada yang Tampak Menyadarinya Secara Luas.

Pendekatan Perlindungan AI Hibrida Amazon Mendorong Permintaan Pemeriksaan Aturan yang Menangkap Halusinasi AI dan Menjaga LLM Tetap Jujur

Pendekatan Perlindungan AI Hibrida Amazon Mendorong Permintaan Pemeriksaan Aturan yang Menangkap Halusinasi AI dan Menjaga LLM Tetap Jujur

Orang-orang yang bermain-main dengan AI pendeteksi emosi dengan berpura-pura menunjukkan reaksi emosional dapat menyebabkan kebiasaan emosional masyarakat yang luas dan histeria.

Forbes

Teknologi

3 bulan lalu

149 dibaca

Orang-orang yang bermain-main dengan AI pendeteksi emosi dengan berpura-pura menunjukkan reaksi emosional dapat menyebabkan kebiasaan emosional masyarakat yang luas dan histeria.

LLM memiliki dua wajah dengan berpura-pura mematuhi keselarasan AI yang dijunjung tinggi, tetapi kemudian berubah menjadi pengkhianat tanpa jiwa.

Forbes

Teknologi

3 bulan lalu

106 dibaca

LLM memiliki dua wajah dengan berpura-pura mematuhi keselarasan AI yang dijunjung tinggi, tetapi kemudian berubah menjadi pengkhianat tanpa jiwa.

ChatGPT o3 dari OpenAI yang dipimpin oleh Sam Altman sedang bertaruh besar pada penyelarasan deliberatif untuk menjaga AI tetap dalam batasan dan tidak beracun.

Forbes

Teknologi

4 bulan lalu

157 dibaca

ChatGPT o3 dari OpenAI yang dipimpin oleh Sam Altman sedang bertaruh besar pada penyelarasan deliberatif untuk menjaga AI tetap dalam batasan dan tidak beracun.

Rantai Pemikiran Berkelanjutan Menjanjikan Peningkatan Besar untuk LLM dan AI Generatif dengan Menghancurkan Fokus pada Token

Forbes

Teknologi

4 bulan lalu

46 dibaca

Rantai Pemikiran Berkelanjutan Menjanjikan Peningkatan Besar untuk LLM dan AI Generatif dengan Menghancurkan Fokus pada Token

Kecerdikan Licik di Batas Antara AI Versus AGI dan Akhirnya Kecerdasan Super AI

Forbes

Teknologi

4 bulan lalu

73 dibaca

Kecerdikan Licik di Batas Antara AI Versus AGI dan Akhirnya Kecerdasan Super AI

Sam Altman Mengungkapkan Kekurangan Sebelumnya Dalam AI Canggih OpenAI o1 Selama Pengumuman ChatGPT Pro, Namun Tidak Ada yang Tampak Menyadarinya Secara Luas.

Forbes

Teknologi

4 bulan lalu

151 dibaca

Sam Altman Mengungkapkan Kekurangan Sebelumnya Dalam AI Canggih OpenAI o1 Selama Pengumuman ChatGPT Pro, Namun Tidak Ada yang Tampak Menyadarinya Secara Luas.

Pendekatan Perlindungan AI Hibrida Amazon Mendorong Permintaan Pemeriksaan Aturan yang Menangkap Halusinasi AI dan Menjaga LLM Tetap Jujur

Forbes

Teknologi

4 bulan lalu

87 dibaca

Pendekatan Perlindungan AI Hibrida Amazon Mendorong Permintaan Pemeriksaan Aturan yang Menangkap Halusinasi AI dan Menjaga LLM Tetap Jujur