IT House News am 19. Juni: Meta hat derzeit das Voicebox AI-Modell veröffentlicht. Im Vergleich zu Konkurrenzmodellen, die nur Text oder Bilder zum Antworten verwenden können, besteht der Hauptvorteil des Voicebox AI-Modells darin, dass es Audionachrichten generieren kann für die Antwort.
▲ Funktionen des Voicebox AI-Modells, Bildquellen-Meta
Es wird berichtet, dass das Voicebox AI-Modell nur ein 2-Sekunden-Audiobeispiel benötigt, um Audiodetails und Klangfarbe genau zu identifizieren und es basierend auf den Textergebnissen in eine Sprachausgabe umzuwandeln, die Englisch, Französisch, Deutsch und Spanisch unterstützt. Voicebox bietet außerdem die Möglichkeit, den fehlenden Inhalt basierend auf dem Inhalt vor und nach dem Sprachclip zu ergänzen.
▲ Funktionen des Voicebox AI-Modells, Bildquellen-Meta
▲ Funktionen des Voicebox AI-Modells, Bildquellen-Meta
Meta sagt, dass Voicebox natürliche und realistische Spracheffekte für KI-basierte virtuelle Assistenten oder NPCs im Metaverse bereitstellen kann. Voicebox kann bestimmte Hilfestellungen bieten, um Menschen mit geschädigten Stimmbändern zu einer barrierefreien Kommunikation zu verhelfen.
Nach einer Anfrage stellte IT House fest, dass sich das Voicebox-KI-Modell noch im Forschungs- und Entwicklungsstadium befindet. Meta gab an, dass sie sich darüber im Klaren seien, dass diese Technologie der künstlichen Intelligenz potenzielle Schäden im Hinblick auf falsche Fälschungen mit sich bringen könne, weshalb Meta derzeit hart daran arbeite, eine wirksame Möglichkeit zu finden, zwischen echter Sprache und von Voicebox erzeugtem Audio zu unterscheiden, bevor eine Lösung gefunden werde vorerst der Öffentlichkeit zugänglich gemacht werden. Weitere Informationen zum Voicebox-Modell finden Sie aktuell hier.
Das obige ist der detaillierte Inhalt vonMeta veröffentlicht Voicebox-KI-Modell: Es kann Audioinformationen für NPC-Gespräche usw. generieren.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!