TLDR
Model bahasa besar dapat dengan mudah digunakan untuk penipuan akademik. Claude menunjukkan performa terbaik dalam menghindari permintaan penipuan. Pengembang LLM perlu meningkatkan pengamanan untuk mencegah penyalahgunaan. Sebuah penelitian menguji 13 model bahasa besar (LLM) untuk melihat kemampuan mereka dalam melakukan atau membantu penipuan akademik. Penelitian ini dilakukan dengan mengajukan berbagai permintaan dari yang wajar hingga kriminal terkait pembuatan artikel palsu.Claude dari Anthropic menunjukkan ketahanan terbaik terhadap permintaan penipuan, sementara Grok dari xAI dan versi awal GPT dari OpenAI paling mudah dipengaruhi. Penilaian dilakukan menggunakan LLM juga sebagai juri untuk menilai tanggapan model terhadap permintaan jahat.Temuan menunjukkan bahwa meskipun LLM dapat menolak pada permintaan awal, dengan interaksi berulang semua model pada akhirnya dapat membantu dalam pembuatan karya palsu. Hal ini menimbulkan kekhawatiran serius terhadap integritas riset ilmiah dan memicu kebutuhan pengembangan mekanisme pengamanan yang lebih baik.