DeepSeek Perkenalkan Teknologi AI Baru untuk Proses Data Lebih Cepat dan Hemat
Teknologi
Kecerdasan Buatan
19 Feb 2025
208 dibaca
1 menit

Rangkuman 15 Detik
DeepSeek fokus pada pengembangan teknologi AI yang efisien dan hemat biaya.
Native Sparse Attention (NSA) dapat meningkatkan kinerja model AI tanpa mengorbankan biaya pelatihan.
Partisipasi Liang Wenfeng dalam simposium menunjukkan pentingnya kolaborasi antara teknologi dan kebijakan pemerintah.
DeepSeek, sebuah perusahaan rintisan yang didirikan oleh Liang Wenfeng, baru saja menerbitkan studi teknis tentang "native sparse attention" (NSA), yang bertujuan untuk membuat model kecerdasan buatan (AI) lebih efisien dalam memproses data besar. Studi ini ditulis oleh Liang dan 15 penulis lainnya, dan dipublikasikan di arXiv sehari sebelum Liang berpartisipasi dalam simposium yang diadakan oleh Presiden Xi Jinping di Beijing. DeepSeek kini lebih fokus pada penelitian dan tidak terburu-buru untuk mengumpulkan dana atau melakukan kegiatan komersial baru.
Dalam studi tersebut, Liang dan tim ilmuwan muda di DeepSeek menunjukkan kemajuan mereka dalam mengembangkan model AI open-source yang canggih, seperti V3 dan R1, dengan biaya dan daya komputasi yang jauh lebih rendah dibandingkan perusahaan teknologi besar. NSA dirancang untuk mempercepat proses inferensi, yaitu saat model AI mulai mengenali pola dalam data yang belum pernah dilihat sebelumnya, tanpa mengorbankan kinerja.
Analisis Ahli
Yoshua Bengio
Inovasi seperti Native Sparse Attention sangat krusial untuk kemajuan AI karena memungkinkan pengurangan sumber daya komputasi tanpa kehilangan akurasi, yang akan membuat teknologi AI lebih inklusif dan terjangkau.Andrew Ng
Fokus pada efisiensi dan optimasi hardware-aligned seperti yang dilakukan DeepSeek adalah langkah penting untuk mempercepat adopsi luas AI di berbagai industri, terutama di negara berkembang.


