Bagaimana Model Difusi AI Menghasilkan Kreativitas Melalui Keterbatasan Tekniknya
Teknologi
Kecerdasan Buatan
30 Jun 2025
30 dibaca
2 menit

Rangkuman 15 Detik
Kreativitas dalam model difusi muncul dari proses denoising dan bukan semata-mata dari memorisasi.
Lokalitas dan ekuivarian berperan penting dalam memungkinkan kreativitas dalam gambar yang dihasilkan oleh AI.
Penelitian ini menawarkan pandangan baru tentang persamaan antara kreativitas manusia dan kecerdasan buatan.
Para peneliti awalnya terkejut karena model AI yang dikenal sebagai model difusi dapat menghasilkan gambar baru yang kreatif, bukan hanya menyalin gambar yang sudah mereka pelajari. Model ini bekerja dengan cara yang mirip seperti merusak gambar hingga menjadi noise dan kemudian mencoba menyusunnya kembali.
Dua peneliti fisika mengembangkan sebuah sistem matematika yang disebut mesin setara lokal ekuivarien (ELS) yang mampu memprediksi bagaimana model difusi menghasilkan gambar tanpa perlu dilatih secara langsung. Hal ini menunjukkan kreativitas model sebenarnya adalah konsekuensi dari cara mereka bekerja, terutama sifat lokalitas dan translasi ekuivarien.
Model difusi hanya fokus pada sebagian kecil gambar pada satu waktu, tanpa melihat keseluruhan gambar. Ironisnya, pembatasan ini justru membuat mereka bisa berimprovisasi dan menghasilkan gambar baru yang koheren, termasuk efek aneh seperti manusia dengan jari ekstra pada gambar yang mereka buat.
Kreativitas yang muncul dari model AI ini mirip dengan proses biologis dalam pertumbuhan dan pembentukan tubuh makhluk hidup, di mana tindakan lokal dan komunikasi antar bagian kecil menciptakan pola dan bentuk kompleks tanpa pengawasan pusat.
Penemuan ini membuka kemungkinan pemahaman baru tentang bagaimana kreativitas manusia dan mesin bisa memiliki mekanisme dasar yang sama, yaitu menciptakan sesuatu yang baru dari pemrosesan informasi yang terbatas dan saling berinteraksi.


