Pomodo
HomeTeknologiBisnisSainsFinansial

DeepSeek Ungkap Rahasia Keberhasilan AI Murah Lewat Co-Design Perangkat Keras Dan Lunak

Teknologi
Kecerdasan Buatan
News Publisher
16 Mei 2025
1429 dibaca
2 menit
DeepSeek Ungkap Rahasia Keberhasilan AI Murah Lewat Co-Design Perangkat Keras Dan Lunak

TLDR

DeepSeek berhasil mengembangkan sistem AI open-source yang efisien biaya melalui pendekatan inovatif.
Penggunaan GPU Nvidia H800 memungkinkan DeepSeek untuk melatih model AI dengan skala besar meskipun ada tantangan regulasi.
Arsitektur mixture-of-experts menawarkan cara baru dalam merancang model AI untuk meningkatkan efisiensi dan kolaborasi.
DeepSeek, sebuah start-up AI dari China, mengungkap rahasia di balik keberhasilan mereka membangun sistem AI open-source yang sangat kuat namun dengan biaya yang jauh lebih rendah dibandingkan pesaingnya. Pendekatan yang mereka gunakan adalah gabungan antara desain perangkat keras dan perangkat lunak yang saling melengkapi.Dalam makalah terbaru yang ditulis bersama oleh pendiri DeepSeek, Liang Wenfeng, dijelaskan bahwa mereka menggunakan ribuan GPU Nvidia H800 yang sempat dilarang ekspor ke China untuk melatih model AI mereka. Keberhasilan ini didukung oleh teknik optimasi yang meningkatkan efisiensi memori dan komunikasi antar-chip.Salah satu inovasi penting dalam sistem DeepSeek adalah penggunaan model mixture-of-experts (MoE), yakni membagi model AI menjadi beberapa sub-jaringan yang masing-masing menangani bagian tertentu dari data. Ini memungkinkan proses pelatihan yang lebih efisien dan lebih hemat biaya.DeepSeek sadar akan keterbatasan perangkat keras dan biaya pelatihan yang sangat tinggi untuk model bahasa besar seperti yang dipakai dalam chatbot AI populer. Karena itu, mereka fokus pada co-design hardware dan software untuk mengatasi tantangan tersebut dengan cara baru.Makalah tersebut menyatakan bahwa strategi DeepSeek dapat menjadi contoh praktis dan blueprint untuk inovasi di bidang sistem AI generasi berikutnya, khususnya dari sisi pemanfaatan perangkat keras yang efisien dan model arsitektur yang inovatif.
Baca Berita Lebih Cepat,Lebih Cerdas
Rangkuman berita terkini yang dipersonalisasi untukmu — tanpa perlu baca panjang lebar.