Courtesy of NatureMagazine
Peneliti dari perusahaan teknologi Meta telah menciptakan sistem penerjemahan berbasis mesin yang dapat menerjemahkan ucapan dalam 101 bahasa ke dalam 36 bahasa target hampir secara instan. Sistem ini, yang disebut SEAMLESSM4T, tidak hanya dapat menerjemahkan ucapan ke teks, tetapi juga teks ke ucapan dan teks ke teks. Meta berencana untuk membagikan sistem ini secara terbuka agar peneliti lain dapat mengembangkannya lebih lanjut. Penerjemahan mesin telah berkembang pesat berkat penggunaan jaringan saraf yang dilatih dengan data besar, meskipun masih ada kekurangan data untuk banyak bahasa.
Tim Meta mengumpulkan jutaan jam rekaman audio dan terjemahan yang dihasilkan manusia dari berbagai sumber, termasuk arsip PBB. Mereka menemukan bahwa membuat sistem penerjemahan menjadi multibahasa dapat meningkatkan kinerjanya, bahkan untuk bahasa yang memiliki data pelatihan terbatas. Dengan mencocokkan audio dengan teks, mereka berhasil menciptakan model yang lebih efektif dalam menerjemahkan berbagai bahasa.
Pertanyaan Terkait
Q
Apa itu sistem SEAMLESSM4T yang dikembangkan oleh Meta?A
Sistem SEAMLESSM4T adalah sistem terjemahan multibahasa yang dapat menerjemahkan ucapan dalam 101 bahasa ke dalam 36 bahasa target.Q
Mengapa data untuk terjemahan bahasa tertentu sulit didapat?A
Data untuk terjemahan bahasa tertentu sulit didapat karena bahasa-bahasa tersebut jarang muncul di internet, sehingga mengurangi jumlah data pelatihan yang tersedia.Q
Apa tujuan dari proyek No Language Left Behind?A
Tujuan dari proyek No Language Left Behind adalah untuk menyediakan terjemahan teks untuk sekitar 200 bahasa yang kurang terwakili.Q
Bagaimana Meta mengumpulkan data untuk melatih sistem terjemahan mereka?A
Meta mengumpulkan data dengan mengumpulkan jutaan jam file audio ucapan dan terjemahan yang dihasilkan manusia dari internet dan sumber lain seperti arsip PBB.Q
Apa kontribusi Cornell University dalam penelitian ini?A
Cornell University berkontribusi dengan memberikan wawasan tentang pentingnya data dalam pengembangan sistem terjemahan dan tantangan yang dihadapi dalam penelitian ini.