Pomodo
HomeTeknologiBisnisSainsFinansial

Biaya Tinggi Pengujian Model Reasoning AI Mengancam Transparansi Hasil

Teknologi
Kecerdasan Buatan
News Publisher
10 Apr 2025
246 dibaca
1 menit
Biaya Tinggi Pengujian Model Reasoning AI Mengancam Transparansi Hasil

AI summary

Model reasoning cenderung lebih mahal untuk diuji dibandingkan model non-reasoning.
Biaya evaluasi meningkat seiring dengan kompleksitas benchmark yang digunakan.
Akses gratis ke model dapat mempengaruhi integritas hasil evaluasi.
AI labs like OpenAI claim that their reasoning AI models are more capable in specific domains, but these models are expensive to benchmark, making independent verification difficult. Artificial Analysis, a third-party AI testing outfit, has spent significantly more on evaluating reasoning models compared to non-reasoning models.The high costs are mainly due to the large number of tokens generated by reasoning models during benchmarking tests. Modern benchmarks often involve complex, multi-step tasks that elicit a lot of tokens, adding to the expense.Experts like George Cameron and Ross Taylor highlight the challenges and rising costs of benchmarking, which could hinder academic research. Despite the high costs, the performance of AI models has improved over time, although evaluating the best models remains expensive.

Experts Analysis

George Cameron
Artificial Analysis akan meningkatkan anggaran benchmarking karena tren rilis model reasoning semakin meningkat, menunjukkan kebutuhan untuk evaluasi terus menerus dalam skala besar.
Ross Taylor
Kesulitan reproduksi hasil benchmarking karena biaya yang sangat tinggi membuat keilmuan AI jadi meragukan dan menimbulkan isu validitas ilmiah.
Jean-Stanislas Denain
Meskipun biaya per token naik, efisiensi model makin meningkat sehingga biaya keseluruhan untuk mencapai performa tertentu malah turun dari waktu ke waktu.
Editorial Note
Biaya benchmarking yang sangat mahal untuk model reasoning menjadi penghalang besar dalam pengembangan AI yang transparan dan bisa diuji secara adil oleh komunitas luas. Jika biaya ini tidak dikendalikan, risiko dominasi narasi oleh lab AI besar makin besar dan inovasi bisa semakin terkunci di tangan segelintir pihak saja.
Baca Berita Lebih Cepat,Lebih Cerdas
Rangkuman berita terkini yang dipersonalisasi untukmu — tanpa perlu baca panjang lebar.