AI summary
AlphaEvolve adalah inovasi baru dalam sistem AI yang bertujuan untuk menyelesaikan masalah optimisasi. Sistem ini mengurangi halluinasis dengan menggunakan evaluasi otomatis, meningkatkan akurasi jawaban. AlphaEvolve menunjukkan kemampuan untuk meningkatkan efisiensi operasional di Google, meskipun dengan beberapa keterbatasan. DeepMind, lab riset AI milik Google, mengembangkan sistem AI baru bernama AlphaEvolve yang dirancang untuk menyelesaikan masalah yang bisa dinilai secara otomatis. Sistem ini bertujuan mengurangi kesalahan atau halusinasi dalam model AI dengan menggunakan metode evaluasi otomatis pada jawaban yang dihasilkan.AlphaEvolve menggunakan model canggih bernama Gemini untuk menghasilkan, mengkritik, dan mengevaluasi berbagai jawaban atas sebuah permasalahan. Dengan begitu, sistem ini hanya bekerja pada masalah yang dapat dievaluasi secara otomatis, dan hanya dapat menghasilkan solusi berbasis algoritma.Dalam tesnya, AlphaEvolve mampu menemukan solusi terbaik untuk sekitar 75% dari 50 soal matematika yang diuji, dan bahkan menemukan solusi yang lebih baik untuk 20% masalah tersebut. Ini menunjukkan kemampuan sistem dalam mengoptimalkan solusi yang sudah dikenal.Selain pengujian matematika, AlphaEvolve juga diuji untuk masalah praktis seperti meningkatkan efisiensi pusat data Google dan mempercepat pelatihan model AI Gemini. Hasilnya, sistem berhasil menghemat sekitar 0,7% sumber daya komputasi Google dan mempercepat waktu pelatihan model sebesar 1%.Meskipun sistem ini tidak menemukan penemuan baru yang revolusioner, AlphaEvolve membantu menghemat waktu dan sumber daya sehingga para ahli dapat fokus pada pekerjaan yang lebih penting. Ini memberikan nilai tambah dalam pengembangan AI dan optimasi infrastruktur teknologi.
AlphaEvolve menunjukkan bahwa pendekatan generasi-jawaban-kritik-evaluasi bisa mengurangi kesalahan model AI yang selama ini menjadi masalah besar. Namun, keterbatasan dalam jenis masalah yang dapat diselesaikan membuatnya kurang fleksibel, sehingga masih perlu dikembangkan untuk menangani masalah dengan kompleksitas dan bentuk yang lebih beragam.