2023-06-21 05:17:13 Pengarang: Lao Wang
Baru-baru ini, Meta melancarkan model suara kecerdasan buatan yang dipanggil Voicebox. Berbanding dengan model yang biasanya memfokuskan pada teks dan imej, Voicebox mencipta mesej suara untuk balasan. Menurut laporan, model ini boleh mengenal pasti butiran audio dan timbre dengan tepat dalam hanya 2 saat sampel audio, dan menukar hasil teks kepada output pertuturan. Pada masa ini, Voicebox menyokong bahasa Inggeris, Perancis, Jerman dan Sepanyol. Kotak suara boleh mengisi bahagian yang hilang berdasarkan kandungan sebelum dan selepas klip suara.
Teknologi ini boleh memberikan kesan suara semula jadi dan realistik untuk pembantu maya atau NPC dalam Metaverse. Kotak suara boleh membantu orang yang mempunyai pita suara yang rosak untuk mencapai fungsi bebas halangan pada tahap tertentu. Walau bagaimanapun, Voicebox masih dalam peringkat penyelidikan dan pembangunan. Meta berkata bahawa teknologi kecerdasan buatan sebegini boleh berpotensi memudaratkan dari segi pemalsuan palsu, jadi syarikat sedang berusaha keras untuk mencari cara untuk membezakan secara berkesan antara pertuturan sebenar dan audio yang dijana Voicebox. Model tidak akan tersedia secara umum sehingga penyelesaian ditemui.
Atas ialah kandungan terperinci Meta mengeluarkan Voicebox model AI suara untuk membantu pembantu maya berkomunikasi dengan NPC. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!