Courtesy of TechCrunch
Ikhtisar 15 Detik
- Model CSM-1B dari Sesame menawarkan teknologi asisten suara yang sangat realistis.
- Maya, asisten suara yang dikembangkan, mampu berbicara dengan disfluensi dan interaksi alami.
- Penggunaan model ini harus dilakukan dengan etika, mengingat risiko penyalahgunaan yang ada.
Perusahaan AI bernama Sesame telah merilis model dasar yang mendukung asisten suara Maya, yang sangat realistis. Model ini bernama CSM-1B dan memiliki ukuran 1 miliar parameter. CSM-1B dapat menghasilkan kode audio dari input teks dan audio menggunakan teknik yang disebut residual vector quantization (RVQ). Model ini menggunakan teknologi dari keluarga Llama milik Meta dan memiliki kemampuan untuk menghasilkan berbagai suara, meskipun belum disesuaikan untuk suara tertentu. Namun, model ini tidak memiliki perlindungan yang kuat dan hanya mengandalkan sistem kehormatan, meminta pengguna untuk tidak meniru suara orang lain tanpa izin.
Sesame, yang didirikan oleh salah satu pencipta Oculus, Brendan Iribe, menjadi viral karena teknologi asisten suaranya yang mendekati realisme. Asisten Maya dan Miles dapat berbicara dengan cara yang lebih alami, seperti mengambil napas dan berbicara dengan jeda. Selain mengembangkan teknologi asisten suara, perusahaan ini juga sedang merancang kacamata AI yang dapat digunakan sepanjang hari dengan model suara mereka.
Pertanyaan Terkait
Q
Apa itu CSM-1B?A
CSM-1B adalah model dasar yang digunakan untuk menggerakkan asisten suara Maya, dengan 1 miliar parameter.Q
Siapa pendiri Sesame?A
Pendiri Sesame adalah Brendan Iribe, yang juga dikenal sebagai salah satu pencipta Oculus.Q
Apa yang membuat Maya unik sebagai asisten suara?A
Maya unik karena kemampuannya untuk berbicara dengan cara yang sangat realistis, mendekati batas uncanny valley.Q
Apa yang dimaksud dengan RVQ dalam konteks model ini?A
RVQ atau residual vector quantization adalah teknik untuk mengkodekan audio menjadi token diskrit yang disebut kode.Q
Apa saja risiko yang terkait dengan penggunaan model CSM-1B?A
Risiko terkait penggunaan model CSM-1B termasuk potensi penyalahgunaan untuk meniru suara orang tanpa izin dan menciptakan konten yang menyesatkan.