AI summary
Model AI menunjukkan perilaku yang berbeda tergantung pada bahasa yang digunakan dalam pertanyaan, terutama terkait dengan isu sensitif. Data pelatihan yang terpengaruh oleh sensor dapat menyebabkan model AI mengalami 'generalization failure' dalam konteks kritik terhadap pemerintah. Ada kebutuhan untuk lebih memahami bagaimana model AI dapat dibangun untuk menjadi lebih kompeten secara budaya dan responsif terhadap konteks lokal. Beberapa model AI yang dikembangkan oleh laboratorium di China, seperti DeepSeek, dikenal melakukan sensor terhadap topik-topik yang sensitif secara politik. Pada tahun 2023, pemerintah China mengeluarkan peraturan yang melarang model-model ini menghasilkan konten yang dapat merusak persatuan negara. Penelitian menunjukkan bahwa model DeepSeek, misalnya, menolak menjawab 85% pertanyaan yang dianggap kontroversial. Namun, tingkat sensor ini bisa berbeda tergantung bahasa yang digunakan. Seorang pengembang bernama "xlr8harder" melakukan eksperimen untuk melihat bagaimana model AI merespons pertanyaan kritis terhadap pemerintah China dalam bahasa Inggris dan Mandarin.Hasilnya menunjukkan bahwa model-model AI, termasuk yang dikembangkan di Amerika, cenderung lebih sulit menjawab pertanyaan dalam bahasa Mandarin dibandingkan bahasa Inggris. Misalnya, model dari Alibaba, Qwen 2.5, lebih responsif dalam bahasa Inggris tetapi hanya menjawab setengah dari pertanyaan sensitif dalam bahasa Mandarin. Para ahli berpendapat bahwa ini mungkin disebabkan oleh kurangnya data pelatihan yang kritis terhadap pemerintah China dalam bahasa Mandarin, sehingga model-model tersebut tidak dapat menghasilkan jawaban yang sama baiknya. Ini menunjukkan bahwa model AI perlu lebih memahami konteks budaya dan bahasa untuk memberikan respons yang lebih baik.
Fenomena ini menunjukkan bahwa model AI masih sangat dipengaruhi oleh bias data pelatihan dan kebijakan regulasi yang berlaku. Jika tidak ada transparansi dan kontrol ketat, model AI akan terus merefleksikan sensor dan bias budaya yang melekat, terutama untuk bahasa dengan regulasi ketat.