2023-06-21 05:17:13 Auteur : Lao Wang
Récemment, Meta a lancé un modèle vocal d'intelligence artificielle appelé Voicebox. Par rapport aux modèles qui se concentrent généralement sur le texte et les images, Voicebox crée des messages vocaux pour les réponses. Selon les rapports, ce modèle peut identifier avec précision les détails audio et le timbre en seulement 2 secondes d'échantillons audio, et convertir les résultats textuels en sortie vocale. Actuellement, Voicebox prend en charge l'anglais, le français, l'allemand et l'espagnol. Voicebox peut remplir les parties manquantes en fonction du contenu avant et après le clip vocal.
Cette technologie peut fournir des effets vocaux naturels et réalistes pour les assistants virtuels ou les PNJ du Metaverse. Voicebox peut aider les personnes dont les cordes vocales sont endommagées à accéder dans une certaine mesure à des fonctions sans obstacle. Cependant, Voicebox est encore en phase de recherche et développement. Meta a déclaré qu'une telle technologie d'intelligence artificielle peut être potentiellement dangereuse en termes de fausse contrefaçon. La société travaille donc dur pour trouver des moyens de distinguer efficacement la parole réelle de l'audio généré par Voicebox. Le modèle ne sera pas rendu public tant qu’une solution n’aura pas été trouvée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!