AI untuk harga sandwich: Qwen dari Alibaba memungkinkan terobosan di AS
Courtesy of SCMP

Rangkuman Berita: AI untuk harga sandwich: Qwen dari Alibaba memungkinkan terobosan di AS

SCMP
Dari SCMP
10 Februari 2025 pukul 20.00 WIB
128 dibaca
Share
Ikhtisar 15 Detik
  • Model S1 menunjukkan kemajuan signifikan dalam pengembangan AI dengan biaya rendah.
  • Kolaborasi antara universitas dan perusahaan teknologi seperti Alibaba dapat mempercepat inovasi dalam bidang AI.
  • Kualitas model dasar sangat penting dalam menentukan keberhasilan pelatihan model AI.
Peneliti dari Stanford University dan University of Washington baru-baru ini mengembangkan model pemikiran baru bernama S1, yang dilatih dengan biaya kurang dari USRp 822.25 miliar ($50 m) enggunakan teknologi open-source dari Alibaba. Model ini menunjukkan kemampuan yang lebih baik dalam matematika dan pemrograman dibandingkan dengan model dari OpenAI. Keberhasilan ini menunjukkan bahwa China semakin mendekati kemampuan AI yang dimiliki oleh negara-negara lain, terutama Amerika Serikat, setelah peluncuran model DeepSeek yang juga berbiaya rendah dan berkinerja tinggi.
Biaya untuk menjalankan perangkat keras yang diperlukan untuk mengembangkan model S1 sangat rendah, hanya sekitar USRp 230.23 ribu ($14) , karena model ini dilatih selama 26 menit menggunakan 16 chip Nvidia H100. Para peneliti percaya bahwa kualitas model dasar yang digunakan sangat penting untuk mencapai hasil yang baik dengan biaya yang rendah. Ini menunjukkan bahwa dengan teknologi yang tepat, pengembangan AI yang efisien dan efektif bisa dilakukan tanpa mengeluarkan banyak uang.

Pertanyaan Terkait

Q
Apa yang dimaksud dengan model S1?
A
Model S1 adalah model pemodelan alasan yang dikembangkan dengan biaya rendah menggunakan teknologi dari Alibaba.
Q
Siapa yang terlibat dalam pengembangan model S1?
A
Pengembangan model S1 melibatkan ilmuwan komputer seperti Li Feifei dari Stanford University dan peneliti dari University of Washington.
Q
Apa peran Alibaba dalam pengembangan model AI?
A
Alibaba menyediakan teknologi open-source yang memungkinkan pengembangan model AI dengan biaya yang lebih rendah.
Q
Bagaimana biaya pelatihan model S1 dibandingkan dengan model AI lainnya?
A
Biaya pelatihan model S1 hanya sekitar US$50, jauh lebih rendah dibandingkan dengan model AI lainnya yang lebih mahal.
Q
Apa yang menjadi kunci keberhasilan dalam pelatihan model AI yang kuat?
A
Kualitas model dasar adalah kunci untuk melatih model pemodelan alasan yang kuat dengan biaya rendah.

Rangkuman Berita Serupa

Alibaba meluncurkan pesaing baru DeepSeek, mendorong lonjakan saham sebesar 7%.SCMP
Teknologi
1 bulan lalu
77 dibaca
Alibaba meluncurkan pesaing baru DeepSeek, mendorong lonjakan saham sebesar 7%.
Peneliti AS mengembangkan model penalaran AI dengan biaya hanya Rp 822.25 ribu ($50) , menantang OpenAI dan DeepSeek.InterestingEngineering
Teknologi
2 bulan lalu
126 dibaca
Peneliti AS mengembangkan model penalaran AI dengan biaya hanya Rp 822.25 ribu ($50) , menantang OpenAI dan DeepSeek.
Para peneliti menciptakan pesaing terbuka untuk model 'penalaran' o1 milik OpenAI dengan biaya kurang dari Rp 822.25 ribu ($50) .TechCrunch
Teknologi
2 bulan lalu
93 dibaca
Para peneliti menciptakan pesaing terbuka untuk model 'penalaran' o1 milik OpenAI dengan biaya kurang dari Rp 822.25 ribu ($50) .
Para ahli AI terkemuka di dunia berdiskusi apakah model DeepSeek merupakan pengubah permainan.SCMP
Teknologi
2 bulan lalu
140 dibaca
Para ahli AI terkemuka di dunia berdiskusi apakah model DeepSeek merupakan pengubah permainan.
Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.InterestingEngineering
Teknologi
2 bulan lalu
80 dibaca
Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.
Alibaba merilis model AI yang diklaimnya melampaui DeepSeek-V3.TheJakartaPost
Teknologi
2 bulan lalu
59 dibaca
Alibaba merilis model AI yang diklaimnya melampaui DeepSeek-V3.