Diese Seite berichtete am 16. November, dass Microsoft auf der Ignite-Konferenz ein KI-Tool namens „Azure AI Speech Text-to-Speech (TTS) Avatar“ für Azure AI Speech vorgestellt hat, das angeblich in der Lage ist, realistische menschliche Avatare (digitale Avatare) zu generieren. Personen) ist dieses Tool derzeit öffentlich zur Vorschau und zum Testen zugänglich.
Microsoft sagte, dass Benutzer den TTS-Avatar (Text-to-Speech) von Azure AI Speech verwenden können, um virtuelle Avatare basierend auf „Eingabetext zum Sprechen von Inhalten“ zu erstellen und diese mit einem Fototraining für reale Personen zu kombinieren, um einen virtuellen Avatar zu erstellen auf echte Menschen. Der „interaktive Chatbot“ kann in Unternehmensmarketing-, Geschäfts- oder Kundenservice-Szenarien eingesetzt werden.
Es wird berichtet, dass dieser Azure AI Speech Text-to-Speech (TTS)-Avatar hauptsächlich drei Module umfasst, nämlich Textanalysator, TTS-Sprachsynthesizer und TTS-Virtual-Avatar-Synthesizer:Zunächst wird der Textanalysator von Benutzern verwendet Der eingegebene Textinhalt wird analysiert und eine Phonemsequenz generiert. Anschließend wird das TTS-Sprachmodell im TTS-Sprachsynthesizer die akustischen Eigenschaften des vom Benutzer eingegebenen Textes vorhersagen und den Ton synthetisieren. Schließlich wird das Klangsynthesemodell Avatar des neuronalen Netzwerks das Bild der Lippenform des Charakters basierend auf den oben genannten akustischen Eigenschaften vorhersagen und schließlich ein virtuelles Avatar-Bild erstellenMicrosoft erklärt, dass die herkömmliche Produktion virtueller Charaktere zeitaufwändig und mühsam ist und eine Konstruktion erfordert einer speziellen Aufnahmeumgebung und Nachbearbeitung Der Prozess ist zudem mit erheblichen Kosten verbunden. Mithilfe des neuesten Text-to-Speech-Rollendienstes (TTS) Azure AI Speech von Microsoft müssen Benutzer nach der Einrichtung des Modells nur noch Text eingeben, um verschiedene Produkteinführungen und interaktive Videos zu erstellen. Die Kombination des Microsoft Azure OpenAI-Dienstes und der TTS-Funktion des neuronalen Netzwerks kann auch ein natürlicheres interaktives Erlebnis bieten. Zum Beispiel Videos zur Unternehmenskultur, Produktvorstellungen oder der digitale Avatar des CEO auf Konferenzen. Sie können auch virtuelle Live-Übertragungen digitaler Menschen, Chat-Roboter, Geschäftsroboter oder KI-Lehrer für den Online-Unterricht usw. erstellen. Microsoft sagte, dass Azure AI Speech-to-Text (TTS)-Avatare für Azure-Abonnenten eingeführt wurden und mehrere Sprachen unterstützen. Benutzer können den gewünschten Charakter aus den voreingestellten Avatar-Optionen auswählen oder den Avatar anpassen Wenn der Benutzer den Avatar anpassen möchte, muss er eine Reihe von Charakter-Videoclips hochladen. Die Azure-Plattform verarbeitet diese Videos online und generiert virtuelle Avatare. Der Charakter selbst ist von der Tonquelle getrennt. Benutzer können die offizielle Standard-Tonquelle auswählen oder ihre eigene Trainings-Tonquelle hochladen
Das obige ist der detaillierte Inhalt vonMicrosoft kündigt das Text-To-Speech-Avatar-KI-Tool an: Kann auf Basis der Azure-Plattform virtuelle 3D-Digitalmenschen erstellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!