DeepSeek-R2: Model AI Baru yang Lebih Efisien dan Murah dari China
Courtesy of SCMP

Rangkuman Berita: DeepSeek-R2: Model AI Baru yang Lebih Efisien dan Murah dari China

Memberikan informasi tentang spekulasi dan antisipasi terhadap peluncuran model AI terbaru DeepSeek-R2 serta tolok ukur baru yang ditetapkan dalam efisiensi biaya dan kinerja.

SCMP
DariĀ SCMP
28 April 2025 pukul 19.00 WIB
44 dibaca
Share
Ikhtisar 15 Detik
  • DeepSeek berinovasi dalam pengembangan model AI open-source yang lebih efisien.
  • Model R2 diharapkan dapat menetapkan standar baru dalam industri AI.
  • Arsitektur MoE memungkinkan pengurangan biaya dan peningkatan performa dalam model AI.
China - Spekulasi terbaru tentang peluncuran R2 dari DeepSeek telah menarik perhatian besar di media sosial. DeepSeek, sebuah start-up AI dari China, telah menjadi sorotan sejak akhir Desember 2024 hingga Januari dengan merilis dua model AI open-source canggih, V3 dan R1. Model-model ini dibangun dengan biaya dan daya komputasi yang jauh lebih rendah dibandingkan proyek model bahasa besar dari perusahaan teknologi besar.
R2, yang dikabarkan akan segera diluncurkan, dikembangkan dengan arsitektur hybrid mixture-of-experts (MoE) dan memiliki total 1,2 triliun parameter. Model ini diklaim 97,3 persen lebih murah untuk dibangun dibandingkan GPT-4o dari OpenAI. MoE adalah pendekatan pembelajaran mesin yang membagi model AI menjadi sub-jaringan terpisah, atau ahli, yang masing-masing fokus pada subset data input untuk bersama-sama melakukan tugas.
Pendekatan ini sangat mengurangi biaya komputasi selama pra-pelatihan dan mencapai kinerja lebih cepat selama waktu inferensi. Dengan spekulasi yang meningkat dan antisipasi yang tinggi, peluncuran R2 diharapkan dapat menetapkan tolok ukur baru dalam efisiensi biaya dan kinerja di industri AI. Ini juga menunjukkan bagaimana perusahaan teknologi China terus berinovasi di tengah perang teknologi yang semakin intensif dengan AS.

Rangkuman Berita Serupa

Alibaba merilis model AI yang diklaimnya melampaui DeepSeek-V3.TheJakartaPost
Teknologi
3 bulan lalu
60 dibaca

Alibaba merilis model AI yang diklaimnya melampaui DeepSeek-V3.

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.NatureMagazine
Teknologi
3 bulan lalu
113 dibaca

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing ASWired
Teknologi
3 bulan lalu
61 dibaca

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing AS

DeepSeek China berhasil memecahkan 'cawan suci AI' untuk menggulingkan Google, Meta, dan OpenAI dari AS.InterestingEngineering
Teknologi
3 bulan lalu
111 dibaca

DeepSeek China berhasil memecahkan 'cawan suci AI' untuk menggulingkan Google, Meta, dan OpenAI dari AS.

Model AI murah dan terbuka dari China, DeepSeek, menggembirakan para ilmuwan.NatureMagazine
Teknologi
3 bulan lalu
184 dibaca

Model AI murah dan terbuka dari China, DeepSeek, menggembirakan para ilmuwan.

DeepSeek: Bagaimana Inovator AI China Menantang Status QuoForbes
Teknologi
3 bulan lalu
154 dibaca

DeepSeek: Bagaimana Inovator AI China Menantang Status Quo