AI summary
Kreativitas dalam model difusi muncul dari proses denoising yang dipengaruhi oleh ketidaksempurnaan teknis. Lokalitas dan equivariance translational berperan penting dalam bagaimana model difusi menghasilkan gambar baru. Penelitian ini dapat membuka jalan untuk pemahaman lebih dalam tentang kesamaan antara kreativitas manusia dan AI. Dulu kita membayangkan masa depan dengan mobil yang bisa berjalan sendiri dan pembantu robot, namun kenyataannya perkembangan AI lebih ke kecerdasan digital seperti mengalahkan manusia di catur dan membuat puisi. Salah satu teknologi AI yang menarik adalah model difusi, yang membuat gambar dari data belajar dengan cara mengubah gambar menjadi noise dan kemudian menyusun kembali. Anehnya, meskipun didesain untuk meniru gambar yang dipelajari, model ini bisa menghasilkan gambar baru yang kreatif dan bermakna.Para peneliti lama kebingungan bagaimana model ini bisa berkreasi padahal seharusnya hanya menyalin data. Ternyata, Mason Kamb dan Surya Ganguli menemukan bahwa kreativitas muncul karena hal-hal teknis seperti hanya memproses bagian kecil gambar satu per satu (lokalitas) dan menjaga keteraturan saat gambar digeser (ekuivarian translasi). Mereka membuat model matematika baru bernama ELS yang bisa meniru cara kerja model difusi ini tanpa perlu dilatih.Hasil eksperimen sangat mengejutkan karena model ELS bisa menghasilkan gambar hampir sama persis dengan model difusi besar lainnya dengan akurasi hingga 90%. Ini membuktikan kalau kreativitas sebenarnya adalah akibat langsung dari cara kerja teknis yang membatasi jendela perhatian model tersebut, bukan sesuatu yang membingungkan atau luar biasa di luar logika matematis biasa.Fenomena aneh seperti gambar manusia dengan jari ekstra yang sering muncul di hasil AI sebelumnya juga dijelaskan melalui pendekatan ini. Hal itu terjadi karena model hanya fokus pada bagian kecil gambar tanpa melihat konteks penuh. Hal ini mirip dengan proses biologis di mana bagian tubuh terbentuk dari interaksi lokal sel-sel tanpa pengawasan pusat, yang kadang menghasilkan kelainan.Penemuan ini bukan hanya penting untuk dunia AI melainkan juga memberi petunjuk baru tentang bagaimana kreativitas manusia bisa dipahami sebagai proses menyusun potongan pengalaman menjadi ide baru. Dengan memahami dasar matematis kreativitas AI, kita bisa mengembangkan teknologi yang lebih baik sekaligus mendekati pemahaman tentang kreativitas manusia.
Studi ini sangat penting karena memecahkan mitos bahwa kreativitas dalam AI hanya merupakan efek samping atau kesalahan, justru hal itu adalah hasil dari prinsip arsitektur yang melekat di dalam model. Ini membuka jalan bagi pendekatan desain AI yang lebih terstruktur untuk mengoptimalkan kreativitas secara sistematis.