TLDR
DeepSeek fokus pada pengembangan teknologi AI yang efisien dan hemat biaya. Native Sparse Attention (NSA) dapat meningkatkan kinerja model AI tanpa mengorbankan biaya pelatihan. Partisipasi Liang Wenfeng dalam simposium menunjukkan pentingnya kolaborasi antara teknologi dan kebijakan pemerintah. DeepSeek, sebuah perusahaan rintisan yang didirikan oleh Liang Wenfeng, baru saja menerbitkan studi teknis tentang "native sparse attention" (NSA), yang bertujuan untuk membuat model kecerdasan buatan (AI) lebih efisien dalam memproses data besar. Studi ini ditulis oleh Liang dan 15 penulis lainnya, dan dipublikasikan di arXiv sehari sebelum Liang berpartisipasi dalam simposium yang diadakan oleh Presiden Xi Jinping di Beijing. DeepSeek kini lebih fokus pada penelitian dan tidak terburu-buru untuk mengumpulkan dana atau melakukan kegiatan komersial baru.Dalam studi tersebut, Liang dan tim ilmuwan muda di DeepSeek menunjukkan kemajuan mereka dalam mengembangkan model AI open-source yang canggih, seperti V3 dan R1, dengan biaya dan daya komputasi yang jauh lebih rendah dibandingkan perusahaan teknologi besar. NSA dirancang untuk mempercepat proses inferensi, yaitu saat model AI mulai mengenali pola dalam data yang belum pernah dilihat sebelumnya, tanpa mengorbankan kinerja.