Pomodo
HomeTeknologiBisnisSainsFinansial

Perkembangan Model AI Reasoning Diprediksi Melambat Dalam Waktu Dekat

Teknologi
Kecerdasan Buatan
artificial-intelligence (10mo ago) artificial-intelligence (10mo ago)
13 Mei 2025
244 dibaca
1 menit
Perkembangan Model AI Reasoning Diprediksi Melambat Dalam Waktu Dekat

Rangkuman 15 Detik

Kemajuan model reasoning mungkin akan melambat dalam waktu dekat.
Pelatihan pembelajaran penguatan memerlukan banyak komputasi, tetapi ada batasan pada seberapa jauh ini dapat dioptimalkan.
Biaya overhead penelitian dapat membatasi potensi pengembangan model reasoning di masa depan.
Model reasoning AI, seperti OpenAI o3, telah membawa kemajuan besar dalam kemampuan AI menyelesaikan problem matematika dan pemrograman. Mereka memakai metode pelatihan khusus bernama reinforcement learning untuk meningkatkan performa dari model konvensional yang sudah ada. Saat ini, OpenAI memakai komputasi sekitar 10 kali lebih besar untuk melatih model reasoning terbaru dibandingkan model sebelumnya. Namun, meskipun ada peningkatan besar ini, ada batas seberapa jauh komputasi dapat membantu meningkatkan kemampuan model reasoning. Epoch AI menyatakan bahwa dalam waktu satu tahun atau sesegera mungkin, kemajuan dari model reasoning bisa mulai melambat. Ini karena pertumbuhan kecepatan peningkatan performa pada tahap reinforcement learning yang sangat cepat mulai mendekati batas maksimal skala yang bisa dicapai. Selain keterbatasan komputasi, biaya riset yang tinggi juga menjadi tantangan dalam mengembangkan model reasoning lebih jauh. Model reasoning cenderung lebih mahal dan memiliki kekurangan, seperti sering melakukan kesalahan halusinasi lebih banyak dibandingkan model konvensional. Karena investasi besar di industri AI pada model reasoning, potensi perlambatan kemajuan ini menarik perhatian banyak pihak. Penting untuk terus memantau perkembangan ini karena dapat mempengaruhi masa depan teknologi AI secara keseluruhan.

Analisis Ahli

Josh You
Performa dari pelatihan model AI konvensional meningkat 4x setahun, sementara reinforcement learning naik 10x tiap 3-5 bulan, namun keduanya akan konvergen dalam beberapa tahun ke depan sehingga batas progress akan tercapai.