Pomodo
HomeTeknologiBisnisSainsFinansial

DeepSeek Ungkap Rahasia Keberhasilan AI Murah Lewat Co-Design Perangkat Keras dan Lunak

Teknologi
Kecerdasan Buatan
artificial-intelligence (11mo ago) artificial-intelligence (11mo ago)
16 Mei 2025
83 dibaca
2 menit
DeepSeek Ungkap Rahasia Keberhasilan AI Murah Lewat Co-Design Perangkat Keras dan Lunak

Rangkuman 15 Detik

DeepSeek berhasil mengembangkan sistem AI open-source yang efisien biaya melalui pendekatan inovatif.
Penggunaan GPU Nvidia H800 memungkinkan DeepSeek untuk melatih model AI dengan skala besar meskipun ada tantangan regulasi.
Arsitektur mixture-of-experts menawarkan cara baru dalam merancang model AI untuk meningkatkan efisiensi dan kolaborasi.
DeepSeek, sebuah start-up AI dari China, mengungkap rahasia di balik keberhasilan mereka membangun sistem AI open-source yang sangat kuat namun dengan biaya yang jauh lebih rendah dibandingkan pesaingnya. Pendekatan yang mereka gunakan adalah gabungan antara desain perangkat keras dan perangkat lunak yang saling melengkapi. Dalam makalah terbaru yang ditulis bersama oleh pendiri DeepSeek, Liang Wenfeng, dijelaskan bahwa mereka menggunakan ribuan GPU Nvidia H800 yang sempat dilarang ekspor ke China untuk melatih model AI mereka. Keberhasilan ini didukung oleh teknik optimasi yang meningkatkan efisiensi memori dan komunikasi antar-chip. Salah satu inovasi penting dalam sistem DeepSeek adalah penggunaan model mixture-of-experts (MoE), yakni membagi model AI menjadi beberapa sub-jaringan yang masing-masing menangani bagian tertentu dari data. Ini memungkinkan proses pelatihan yang lebih efisien dan lebih hemat biaya. DeepSeek sadar akan keterbatasan perangkat keras dan biaya pelatihan yang sangat tinggi untuk model bahasa besar seperti yang dipakai dalam chatbot AI populer. Karena itu, mereka fokus pada co-design hardware dan software untuk mengatasi tantangan tersebut dengan cara baru. Makalah tersebut menyatakan bahwa strategi DeepSeek dapat menjadi contoh praktis dan blueprint untuk inovasi di bidang sistem AI generasi berikutnya, khususnya dari sisi pemanfaatan perangkat keras yang efisien dan model arsitektur yang inovatif.

Analisis Ahli

Andrew Ng
Pendekatan hardware-software co-design memang menjadi tren yang penting untuk mendukung perkembangan AI dengan biaya yang lebih rendah dan efisiensi tinggi, terutama bagi start-up yang fokus pada inovasi teknologi.
Fei-Fei Li
Penggunaan mixture-of-experts dalam model besar adalah terobosan besar yang dapat mendorong kapasitas dan efisiensi tanpa perlu menaikkan sumber daya secara eksponensial.