Courtesy of SCMP
DeepSeek, sebuah perusahaan rintisan dari China, telah menarik perhatian banyak orang karena klaimnya tentang biaya dan waktu yang dibutuhkan untuk melatih model kecerdasan buatan (AI) mereka. Dalam sebuah makalah, DeepSeek menyatakan bahwa mereka hanya menghabiskan 2,8 juta jam GPU dengan biaya sekitar 5,6 juta dolar AS untuk melatih model bahasa besar mereka, DeepSeek-V3. Ini jauh lebih sedikit dibandingkan dengan pengeluaran perusahaan teknologi besar di AS. Model lain yang mereka luncurkan, DeepSeek-R1, juga menunjukkan kemampuan yang sebanding dengan model dari perusahaan besar seperti OpenAI dan Google, tetapi dengan biaya pelatihan yang jauh lebih rendah.
Namun, klaim ini menimbulkan keraguan tentang kebutuhan pengeluaran besar yang dilakukan oleh perusahaan teknologi AS, terutama dalam membeli chip AI yang mahal. Hal ini menyebabkan penjualan besar-besaran saham Nvidia, yang mengakibatkan kerugian sebesar 600 miliar dolar AS dalam satu hari. Catatan dari DeepSeek dan dana lindung nilai yang terkait menunjukkan bahwa mereka memiliki sumber daya yang sangat baik untuk melatih AI, termasuk investasi besar dalam GPU dan superkomputer.
Pertanyaan Terkait
Q
Apa yang menjadi fokus utama dari artikel ini?A
Artikel ini membahas pengeluaran besar untuk GPU oleh hedge fund yang mendukung DeepSeek dan implikasinya terhadap pengembangan teknologi AI.Q
Siapa pendiri DeepSeek dan High-Flyer Quant?A
Pendiri DeepSeek dan High-Flyer Quant adalah Liang Wenfeng.Q
Berapa banyak GPU yang dibeli oleh Liang Wenfeng pada tahun 2019?A
Liang Wenfeng membeli 1.100 GPU pada tahun 2019 dengan biaya 200 juta yuan.Q
Apa yang menyebabkan penurunan nilai saham Nvidia?A
Penurunan nilai saham Nvidia disebabkan oleh klaim efisiensi biaya dari model DeepSeek yang menunjukkan kinerja tinggi dengan biaya rendah.Q
Apa yang dimaksud dengan Fire-Flyer 2?A
Fire-Flyer 2 adalah kluster superkomputer yang dikembangkan oleh High-Flyer Quant untuk mencapai kinerja tinggi dalam komputasi.