Pomodo
HomeTeknologiBisnisSainsFinansial

Alibaba Luncurkan Model AI Terbaru untuk Video Karakter Berkualitas Film

Teknologi
Kecerdasan Buatan
artificial-intelligence (7mo ago) artificial-intelligence (7mo ago)
27 Agt 2025
152 dibaca
2 menit
Alibaba Luncurkan Model AI Terbaru untuk Video Karakter Berkualitas Film

Rangkuman 15 Detik

Model Wan2.2-S2V adalah alat inovatif untuk menghasilkan video karakter dari gambar dan audio.
Alibaba Cloud berkomitmen untuk memajukan teknologi AI dengan pendekatan sumber terbuka.
Model ini menunjukkan kemajuan dalam kompetisi antara perusahaan AI Tiongkok dan AS.
Alibaba Cloud baru saja merilis model kecerdasan buatan terbaru bernama Wan2.2-S2V. Model ini mampu mengubah gambar statis dan rekaman audio menjadi video karakter dengan kualitas seperti film. Teknologi ini sangat membantu pembuat konten untuk menghasilkan visual yang ekspresif dan sesuai dengan kebutuhan cerita. Wan2.2-S2V adalah bagian dari keluarga model Wan2.2 yang menggunakan arsitektur canggih bernama Mixture-of-Experts (MoE). Teknologi ini memungkinkan model untuk mencapai performa tinggi dengan efisiensi yang lebih baik dalam memproses informasi audiovisual. Dengan kemampuan audio-driven animation, model ini dapat menciptakan karakter yang hidup dalam video, mulai dari dialog yang alami hingga penampilan musik. Model ini juga bisa menangani beberapa karakter dalam satu adegan secara mulus, sehingga sangat cocok untuk produksi film dan televisi. Salah satu keunggulan Wan2.2-S2V adalah penggunaan dataset audiovisual besar yang disesuaikan khusus untuk scenario produksi film dan televisi. Hal ini membuat hasil video lebih realistis dan sesuai ekspektasi profesional kreatif di industri hiburan. Model ini sudah bisa diunduh secara bebas di platform-platform pengembang populer seperti Hugging Face, GitHub, dan ModelScope milik Alibaba Cloud. Langkah ini memperlihatkan komitmen Alibaba untuk memperluas ekosistem AI open-source dan mempercepat inovasi teknologi video generatif.

Analisis Ahli

Yann LeCun
Pendekatan open-source pada video generasi dengan teknologi MoE merupakan langkah krusial untuk percepatan inovasi di AI generatif, yang sebelumnya lebih dominan di teks dan gambar statis.
Fei-Fei Li
Kemampuan menghasilkan video karakter ekspresif dari input audio dan gambar statis membuka peluang besar untuk aplikasi pendidikan, hiburan, dan interaksi manusia-mesin dengan tingkat personalisasi tinggi.