Tuduhan OpenAI Gunakan Buku Berbayar Tanpa Izin untuk Latih Model AI Terbaru

Teknologi

Kecerdasan Buatan

02 Apr 2025

134 dibaca

2 menit

Tuduhan OpenAI Gunakan Buku Berbayar Tanpa Izin untuk Latih Model AI Terbaru

AI summary

OpenAI dituduh menggunakan konten berbayar tanpa izin untuk melatih model AI mereka.

Penelitian menunjukkan bahwa model GPT-4o memiliki pengenalan yang lebih baik terhadap konten O'Reilly dibandingkan model sebelumnya.

Metode DE-COP digunakan untuk mendeteksi apakah model AI memiliki pengetahuan tentang teks tertentu dari data pelatihan.

OpenAI, perusahaan yang mengembangkan model AI seperti ChatGPT, dituduh menggunakan konten berhak cipta tanpa izin untuk melatih modelnya. Sebuah makalah baru dari organisasi pengawas AI mengklaim bahwa OpenAI mungkin telah menggunakan buku-buku berbayar dari O'Reilly Media tanpa lisensi untuk melatih model GPT-4o, yang merupakan model default di ChatGPT. Penulis makalah tersebut, termasuk pendiri O'Reilly Media, menyatakan bahwa model GPT-4o menunjukkan pengenalan yang lebih kuat terhadap konten buku O'Reilly dibandingkan dengan model sebelumnya, GPT-3.5 Turbo.Para peneliti menggunakan metode yang disebut DE-COP untuk menguji apakah model AI dapat membedakan antara teks yang ditulis manusia dan versi yang dihasilkan oleh AI. Hasilnya menunjukkan bahwa GPT-4o kemungkinan memiliki pengetahuan tentang banyak buku O'Reilly yang tidak dipublikasikan sebelum batas waktu pelatihan model tersebut. Namun, penulis juga mengakui bahwa metode mereka tidak sempurna dan ada kemungkinan OpenAI mendapatkan kutipan buku tersebut dari pengguna yang menyalinnya ke dalam ChatGPT.Meskipun OpenAI memiliki beberapa kesepakatan lisensi untuk data pelatihannya, perusahaan ini sedang menghadapi beberapa tuntutan hukum terkait praktik penggunaan data pelatihan dan hak cipta. Makalah O'Reilly ini menambah tantangan bagi OpenAI dalam menghadapi kritik dan masalah hukum yang sedang berlangsung.

Experts Analysis

Tim O’Reilly

Menggugah kesadaran akan perlunya regulasi yang lebih jelas dan adil dalam penggunaan data berhak cipta oleh perusahaan AI.

Ilan Strauss

Menyoroti pentingnya transparansi dan akuntabilitas dalam pelatihan model AI yang menggunakan data proprietary.

Editorial Note

Dugaan penggunaan data berbayar tanpa izin ini menandakan ketidaksiapan industri AI dalam menangani etika pelatihan data berhak cipta. OpenAI harus segera memperkuat kebijakan pengumpulan data dan transparansi agar kepercayaan publik dapat dipertahankan di tengah ketatnya regulasi hak cipta.

Artikel Serupa

Studi Baru Ungkap GPT-4 Menghafal Konten Berhak Cipta, Perdebatan Hak Cipta Meningkat

05 Apr 2025

237 dibaca

Studi Baru Ungkap GPT-4 Menghafal Konten Berhak Cipta, Perdebatan Hak Cipta Meningkat

Microsoft Ingin Lacak Pengaruh Data Pelatihan AI untuk Hargai Kreator

21 Mar 2025

121 dibaca

Microsoft Ingin Lacak Pengaruh Data Pelatihan AI untuk Hargai Kreator

OpenAI dan Google Desak Pemerintah AS Izinkan AI Pakai Data Berhak Cipta

15 Mar 2025

93 dibaca

OpenAI dan Google Desak Pemerintah AS Izinkan AI Pakai Data Berhak Cipta