AI summary
Cohere meluncurkan model suara pertama mereka, Transcribe, yang merupakan model pengenalan suara otomatis. Model Transcribe dirancang untuk penggunaan dengan GPU kelas konsumen dan mendukung 14 bahasa. Transcribe memiliki performa yang lebih baik dibandingkan model lain dalam hal akurasi dan kecepatan pemrosesan. Cohere meluncurkan Transcribe, model pengenalan suara otomatis open source berukuran 2 miliar parameter yang ditujukan untuk penggunaan dengan GPU konsumen dan mendukung 14 bahasa. Model ini menawarkan keakuratan lebih tinggi dibandingkan rival-rivalnya di benchmark Hugging Face Open ASR dengan nilai WER rata-rata 5,42. Pengembangan ini menjawab kebutuhan pasar yang terus tumbuh untuk aplikasi pencatatan suara dan analisis transkripsi yang presisi dan efisien.Transcribe unggul dalam akurasi dan kecepatan, dapat memproses 525 menit audio dalam satu menit dan meraih tingkat kemenangan 61% atas model lain menurut evaluasi manusia. Namun, model ini masih kalah dalam bahasa Portugis, Jerman, dan Spanyol. Cohere juga berencana mengintegrasikan Transcribe ke platform orkestrasi agent mereka, North, dan menyediakan API gratis serta akses melalui Model Vault.Peluncuran Transcribe berpotensi mempercepat adopsi teknologi pengenalan suara di kalangan perusahaan dan developer yang membutuhkan solusi efisien dan mudah digunakan. Model ini juga mencerminkan tren penting dalam pengembangan AI yang lebih ringan dan terjangkau, memicu kemungkinan perkembangan fitur baru dan penggunaan yang lebih luas di masa depan.
Transcribe merupakan terobosan yang signifikan dengan kombinasi antara performa tinggi dan kemudahan hosting mandiri, yang membuka peluang besar bagi pengguna dengan sumber daya terbatas. Namun, kekurangan pada bahasa tertentu menunjukkan masih ada ruang pengembangan untuk membuat model ini benar-benar universal dan inklusif.