Voicebox dari Meta AI (Sumber gambar: Meta)

Meta Perkenalkan Voicebox, Speech Generation Berbasis Kecerdasan Buatan

27 July 2023   |   16:19 WIB
Image
Indah Permata Hati Jurnalis Hypeabis.id

Perusahaan teknologi Meta memperkenalkan proyek baru bernama Voicebox, sebuah teknologi speech generation berbasis kecerdasan buatan (AI). Ini merupakan langkah Meta dalam mendorong penelitian kecerdasan buatan generatif. Voicebox memiliki fitur utama merubah teks menjadi format suara lewat bicara berbagai jenis ungkapan.

Melansir laman Meta, Voicebox akan menerjemahkan teks dalam bentuk suara dengan ragam variasi. Ada sekitar lima opsi suara yang dapat dipilih pengguna untuk memenuhi kebutuhannya. Namun, Meta tidak hanya bergerak pada ruang text-to-speech saja.

Voicebox dapat digunakan untuk kebutuhan pengeditan suara, pengambilan sampel dan gaya audio. Dengan fitur utama tersebut, Voicebox ditargetkan untuk membantu kreator dalam mengedit trek audio dengan cara yang lebih sederhana. Lebih jauh, Voicebox juga menyasar pada orang tunanetra yang dapat terbantu saat mendengarkan pesan tertulis dari teman melalui suara mereka yang dibacakan oleh model kecerdasan buatan.

Baca juga: Menengok Gedung Baru Sony Music yang Punya Teknologi Dolby Atmos Terkini

Tujuan lainnya adalah memungkinkan orang bisa berbicara bahasa asing apapun menggunakan sampel suara pengguna sendiri. Cara kerja Voicebox masih berbasis kecerdasan buatan yang tidak dilatih secara khusus, sehingga teknologi generatif ini bisa melakukan pembelajaran secara otomatis sesuai dengan konteks.
 

Voicebox dari Meta AI (Sumber gambar: Meta)

Voicebox dari Meta AI (Sumber gambar: Meta)


Voicebox dapat menghasilkan klip audio berkualitas tinggi dan memungkinkan pengeditan audio yang telah direkam sebelumnya. Pengguna dapat mempertahankan konten dan gaya audio sesuai kebutuhan dengan dorongan model multibahasa.

Meta menyebut Voicebox dapat menghasilkan ucapan dalam enam bahasa. Saat ini, Meta menyebut Voicebox data dieksplorasi dalam enam bahasa yakni Inggris, Prancis, Jerman, Spanyol, Polandia, dan Portugis. 

Silang gaya bahasa ini merupakan fitur unggulan Voicebox. Dengan memberi sedikit sampel ucapan atau teks dalam bahasa tertentu, maka Voicebox dapat langsung mengasilkan pembacaan teks dalam salah satu bahasa tersebut.

Baca juga: Qualcomm Kenalkan Teknologi Hybrid AI, Bisa Berjalan Tanpa Internet

Misalnya saat mengetik kalimat dalam Bahasa Jerman, maka Voicebox akan membuat bacaan teks dalam bahasa tersebut. Voicebox mempelajari data yang beragam untuk menghasilkan ucapan yang hampir persis dengan cara bicara orang-orang di dunia nyata dalam menggunakan bahasanya sendiri.

Untuk penggunaan sampel audio, Voicebox dapat menggunakan sampel singkat misalnya dalam dua detik saja. Sampel audio ini tetap bisa dimasukkan untuk kemudian diolah dengan gaya audio lainnya sesuai dengan selera dan kebutuhan pengguna.

Dalam hal pengeditan, Voicebox dirancang dengan kemampuan pengeditan ucapan dan pengurangan noise. Voicebox bisa membuat ulang bagian-bagian ucapan yang mungkin terganggu oleh noise. Pengguna bisa mengganti kata yang salah bicara hanya pada bagian tertentu saja tanpa harus merekam ulang seluruh ucapan dalam audio.

Meta pun mengklaim jika suara yang dihasilkan mulus dan tidak timpang tindih. Meta juga menyebut jika teknologi ini bisa mendorong komunikasi berbasis AI dengan cara yang tetap alami dan autentik. Suaranya dibuat terdengar alami meski mengunakan asisten virtual melalui generatif berbasis kecerdasan buatan.


(Baca artikel Hypeabis.id lainnya di Google News)

Editor: Roni Yunianto 
 

SEBELUMNYA

7 Film Terbaik Aktor Cilian Murphy Selain Oppenheimer, Ada Batman Begins & Dunkirk

BERIKUTNYA

XYZ Festival Umumkan LANY, Rain, The Japanese House, & J-Rocks Dalam Line up Pertama

Komentar


Silahkan Login terlebih dahulu untuk meninggalkan komentar.

Baca Juga: