Informasi

Mengapa Meta tidak merilis chatbot AI yang mengubah teks menjadi ucapan untuk penggunaan publik

Induk perusahaan Facebook, Meta, memperkenalkan chatbot bertenaga kecerdasan buatan (AI) yang dapat mengubah sepotong ucapan baru dari input teks dan klip audio singkat untuk konteks. Disebut Voicebox, perusahaan tersebut mengatakan bahwa ia dapat melakukan tugas-tugas pembuatan ucapan yang tidak dilatih secara khusus. Namun, perusahaan tidak merilis chatbot untuk penggunaan publik.

Menurut Meta, meskipun memiliki beberapa kasus penggunaan, ada faktor risiko yang terlibat dalam merilis chatbot untuk umum.

“Ada banyak kasus penggunaan yang menarik untuk model ucapan generatif, tetapi karena potensi risiko penyalahgunaan, kami tidak membuat model atau kode Kotak Suara tersedia untuk umum saat ini,” kata Meta.

Ia menyoroti bahwa langkah ini diperlukan “untuk mencapai keseimbangan yang tepat antara keterbukaan dan tanggung jawab.”

Apa yang bisa dilakukan Voicebox?
Voicebox sama seperti sistem generatif lainnya untuk gambar dan teks, namun Voicebox menciptakan output dalam bentuk klip audio berkualitas tinggi. Meta mengatakan bahwa ia dapat membuat output dari awal dan bahkan memodifikasi sampel yang diumpankan kepadanya dalam enam bahasa, termasuk bahasa Inggris, Prancis, Jerman, Spanyol, Polandia, dan Portugis.

“Model ini dapat mensintesis ucapan dalam enam bahasa, serta melakukan penghilangan noise, pengeditan konten, konversi gaya, dan pembuatan sampel yang beragam,” katanya.

Kasus penggunaan Voicebox
Meta menjelaskan bahwa Voicebox tidak hanya dapat membuat klip audio berkualitas tinggi, tetapi juga mengedit audio yang sudah direkam sebelumnya, seperti menghilangkan klakson mobil atau gonggongan anjing. Pada saat yang sama, ini mempertahankan konten dan gaya audio.

Di masa depan, kata perusahaan, model AI semacam itu bahkan dapat memberikan suara yang terdengar alami kepada asisten virtual dan karakter non-pemain dalam metaverse atau game.

Lebih jauh lagi, dalam kasus orang tunanetra, mereka dapat mendengar pesan tertulis dari teman dalam suara mereka dengan menggunakan model tersebut. Selain itu, mereka juga dapat membuat musik latar untuk video.

Sumber : https://www.gadgetsnow.com/tech-news/why-meta-is-not-releasing-its-ai-chatbot-that-converts-text-to-speech-for-public-use/articleshow/101114309.cms