Gladia percaya bahwa pemrosesan waktu nyata adalah batasan berikutnya dari API transkripsi audio.
Courtesy of TechCrunch

Rangkuman Berita: Gladia percaya bahwa pemrosesan waktu nyata adalah batasan berikutnya dari API transkripsi audio.

TechCrunch
Dari TechCrunch
15 Oktober 2024 pukul 18.00 WIB
57 dibaca
Share
Startup Prancis bernama Gladia baru saja mengumpulkan dana sebesar Rp 263.12 miliar ($16 juta) dalam putaran pendanaan Seri A. Gladia menawarkan API pengenalan suara yang dapat mengubah file audio menjadi teks dengan akurasi tinggi dan waktu pemrosesan yang cepat. Meskipun perusahaan besar seperti Amazon, Microsoft, dan Google juga memiliki layanan serupa, Gladia bersaing dengan startup lain yang lebih baru dan lebih canggih dalam teknologi ini. Salah satu fitur unggulan Gladia adalah kemampuannya untuk mendeteksi dan memisahkan pembicara dalam percakapan, serta mendukung 100 bahasa dan berbagai aksen.
Dengan dana baru ini, Gladia berencana untuk menyederhanakan proses transkripsi dengan mengintegrasikan kecerdasan audio dan tugas berbasis model bahasa besar (LLM) dalam satu panggilan API. Mereka juga berusaha mengurangi latensi, sehingga transkripsi percakapan langsung dapat dilakukan dengan cepat dan berkualitas tinggi. Gladia percaya bahwa mereka berada di ambang momen besar dalam aplikasi audio, mirip dengan bagaimana ChatGPT mengubah cara orang berinteraksi dengan teknologi. Seiring dengan semakin banyaknya aplikasi yang menggunakan model transkripsi otomatis, Gladia berharap dapat menjadi pilihan utama bagi pengembang yang ingin menambahkan fitur audio dalam produk mereka.

Rangkuman Berita Serupa

Para investor sedang ramai membicarakan AI suara. Berikut adalah tempat di mana mereka melihat potensi yang paling belum dimanfaatkan.YahooFinance
Bisnis
3 bulan lalu
124 dibaca

Para investor sedang ramai membicarakan AI suara. Berikut adalah tempat di mana mereka melihat potensi yang paling belum dimanfaatkan.

ElevenLabs telah mengumpulkan putaran pendanaan baru dengan valuasi lebih dari Rp 49.34 triliun ($3 miliar)  yang dipimpin oleh ICONIQ Growth, kata sumber.TechCrunch
Bisnis
3 bulan lalu
80 dibaca

ElevenLabs telah mengumpulkan putaran pendanaan baru dengan valuasi lebih dari Rp 49.34 triliun ($3 miliar) yang dipimpin oleh ICONIQ Growth, kata sumber.

Synthesia mengumpulkan Rp 2.96 triliun ($180 juta)  dengan valuasi Rp 34.53 triliun ($2,1 miliar)  untuk platform video AI B2B-nya.TechCrunch
Bisnis
3 bulan lalu
86 dibaca

Synthesia mengumpulkan Rp 2.96 triliun ($180 juta) dengan valuasi Rp 34.53 triliun ($2,1 miliar) untuk platform video AI B2B-nya.

Rounded adalah platform orkestra AI yang memungkinkan siapa saja untuk membangun agen suara AI.TechCrunch
Bisnis
3 bulan lalu
130 dibaca

Rounded adalah platform orkestra AI yang memungkinkan siapa saja untuk membangun agen suara AI.

Speak yang didukung oleh OpenAI mengumpulkan Rp 1.28 triliun ($78 juta)  dengan valuasi Rp 16.45 triliun ($1 miliar)  untuk membantu pengguna belajar bahasa dengan berbicara keras.TechCrunch
Teknologi
4 bulan lalu
79 dibaca

Speak yang didukung oleh OpenAI mengumpulkan Rp 1.28 triliun ($78 juta) dengan valuasi Rp 16.45 triliun ($1 miliar) untuk membantu pengguna belajar bahasa dengan berbicara keras.

ElevenLabs sekarang menawarkan kemampuan untuk membangun agen AI percakapan.TechCrunch
Teknologi
5 bulan lalu
81 dibaca

ElevenLabs sekarang menawarkan kemampuan untuk membangun agen AI percakapan.

DeepL meluncurkan DeepL Voice, terjemahan berbasis teks secara real-time dari suara dan video.TechCrunch
Teknologi
5 bulan lalu
109 dibaca

DeepL meluncurkan DeepL Voice, terjemahan berbasis teks secara real-time dari suara dan video.