Peneliti menyarankan OpenAI melatih model AI pada buku O'Reilly yang terbayar.
Courtesy of TechCrunch

Rangkuman Berita: Peneliti menyarankan OpenAI melatih model AI pada buku O'Reilly yang terbayar.

TechCrunch
Dari TechCrunch
02 April 2025 pukul 03.10 WIB
70 dibaca
Share
Ikhtisar 15 Detik
  • OpenAI dituduh menggunakan konten berbayar tanpa izin untuk melatih model AI mereka.
  • Penelitian menunjukkan bahwa model GPT-4o memiliki pengenalan yang lebih baik terhadap konten O'Reilly dibandingkan model sebelumnya.
  • Metode DE-COP digunakan untuk mendeteksi apakah model AI memiliki pengetahuan tentang teks tertentu dari data pelatihan.
OpenAI, perusahaan yang mengembangkan model AI seperti ChatGPT, dituduh menggunakan konten berhak cipta tanpa izin untuk melatih modelnya. Sebuah makalah baru dari organisasi pengawas AI mengklaim bahwa OpenAI mungkin telah menggunakan buku-buku berbayar dari O'Reilly Media tanpa lisensi untuk melatih model GPT-4o, yang merupakan model default di ChatGPT. Penulis makalah tersebut, termasuk pendiri O'Reilly Media, menyatakan bahwa model GPT-4o menunjukkan pengenalan yang lebih kuat terhadap konten buku O'Reilly dibandingkan dengan model sebelumnya, GPT-3.5 Turbo.
Para peneliti menggunakan metode yang disebut DE-COP untuk menguji apakah model AI dapat membedakan antara teks yang ditulis manusia dan versi yang dihasilkan oleh AI. Hasilnya menunjukkan bahwa GPT-4o kemungkinan memiliki pengetahuan tentang banyak buku O'Reilly yang tidak dipublikasikan sebelum batas waktu pelatihan model tersebut. Namun, penulis juga mengakui bahwa metode mereka tidak sempurna dan ada kemungkinan OpenAI mendapatkan kutipan buku tersebut dari pengguna yang menyalinnya ke dalam ChatGPT.
Meskipun OpenAI memiliki beberapa kesepakatan lisensi untuk data pelatihannya, perusahaan ini sedang menghadapi beberapa tuntutan hukum terkait praktik penggunaan data pelatihan dan hak cipta. Makalah O'Reilly ini menambah tantangan bagi OpenAI dalam menghadapi kritik dan masalah hukum yang sedang berlangsung.

Pertanyaan Terkait

Q
Apa tuduhan utama terhadap OpenAI dalam artikel ini?
A
Tuduhan utama adalah bahwa OpenAI menggunakan buku berbayar dari O'Reilly Media tanpa izin untuk melatih model AI mereka.
Q
Siapa yang menulis makalah yang menuduh OpenAI?
A
Makalah tersebut ditulis oleh AI Disclosures Project, yang didirikan oleh Tim O'Reilly dan Ilan Strauss.
Q
Apa yang dimaksud dengan model GPT-4o?
A
GPT-4o adalah model AI terbaru dari OpenAI yang digunakan dalam ChatGPT dan menunjukkan pengenalan yang lebih baik terhadap konten berbayar.
Q
Apa metode DE-COP yang digunakan dalam penelitian?
A
Metode DE-COP adalah teknik untuk mendeteksi konten berhak cipta dalam data pelatihan model bahasa.
Q
Mengapa OpenAI mencari data pelatihan berkualitas tinggi?
A
OpenAI mencari data pelatihan berkualitas tinggi untuk meningkatkan kinerja dan akurasi model AI mereka.

Rangkuman Berita Serupa

Pencurian data DeepSeek: OpenAI mengeluh sementara para kritikus mempertanyakan etika mereka sendiri.InterestingEngineering
Teknologi
2 bulan lalu
137 dibaca
Pencurian data DeepSeek: OpenAI mengeluh sementara para kritikus mempertanyakan etika mereka sendiri.
Apakah OpenAI Korban — DeepSeek dan Hak Kekayaan Intelektual — Sebuah Panduan untuk Para PemimpinForbes
Teknologi
2 bulan lalu
76 dibaca
Apakah OpenAI Korban — DeepSeek dan Hak Kekayaan Intelektual — Sebuah Panduan untuk Para Pemimpin
OpenAI gagal menyediakan alat opt-out yang dijanjikannya pada tahun 2025.TechCrunch
Teknologi
3 bulan lalu
102 dibaca
OpenAI gagal menyediakan alat opt-out yang dijanjikannya pada tahun 2025.
Harvard Mengeluarkan Dataset Pelatihan AI Gratis yang Besar Didanai oleh OpenAI dan MicrosoftWired
Teknologi
4 bulan lalu
122 dibaca
Harvard Mengeluarkan Dataset Pelatihan AI Gratis yang Besar Didanai oleh OpenAI dan Microsoft
Perusahaan berita Kanada menggugat OpenAI.TechCrunch
Teknologi
4 bulan lalu
109 dibaca
Perusahaan berita Kanada menggugat OpenAI.
OpenAI secara tidak sengaja menghapus bukti potensial dalam gugatan hak cipta NY Times (diperbarui)TechCrunch
Teknologi
5 bulan lalu
89 dibaca
OpenAI secara tidak sengaja menghapus bukti potensial dalam gugatan hak cipta NY Times (diperbarui)