微軟在 Ignite 大會上發布了一項名為「Azure AI Speech text to speech (TTS) avatar」的AI工具,聲稱可以產生逼真的虛擬人物形象。這項工具已經開放給大眾進行預覽試用
微軟表示,用戶使用Azure AI Speech text to speech (TTS) avatar,可以建立基於「輸入文字說出內容」的虛擬化身,並結合現實人物照片訓練,建立以真實人物為基礎的「互動式聊天機器人”,可用於企業的行銷、業務或客戶服務等場景。
據報道,Azure AI Speech文字轉語音(TTS)avatar主要由三個模組構成,分別是文字分析器、TTS聲音合成器和TTS虛擬化身合成器
文字分析器會先分析使用者輸入的文字內容,並產生音素序列。然後,TTS聲音合成器中的TTS語音模型將預測使用者輸入文字的聲學特徵,然後合成聲音。最後,神經網路聲音合成模型Avatar會根據上述聲學特徵預測人物的唇形影像,從而最終形成虛擬化身影像
微軟解釋,傳統虛擬化身製作費時耗工,需要建立專用拍攝環境、而拍攝剪輯後製過程也相當花費成本。而當下運用微軟最新的 Azure AI Speech text to speech (TTS) avatar 服務,在初次建立模型後,使用者只要輸入文字就可以製作各種產品介紹、互動影片等。配合微軟 Azure OpenAI Service 及神經網路 TTS 功能,還能呈現更自然的互動體驗。
IT之家報告稱,微軟舉例說明,用戶可以利用Azure AI Speech TTS avatar來批量製作各種視訊內容,例如企業文化影片、產品介紹,或CEO在大會上的數位分身。此外,還可以製作虛擬直播數位人、聊天機器人、業務機器人,以及線上教學的AI老師等等
微軟宣布,Azure AI語音合成(TTS)虛擬形像已經在Azure訂閱用戶中推出,並支援多種語言。使用者可以從預設的虛擬形象選項中選擇所需角色,也可以自訂虛擬形象
如果用戶想要自行自訂虛擬化身,則需要上傳一批人物視頻片段,Azure 平台就會在線上處理這些視頻,從而產生虛擬化身。角色本身與音源分開,使用者可以選擇官方提供的預設音源,也可以自行上傳訓練音源。
以上是微軟公佈 Text To Speech Avatar AI工具,可製作虛擬3D數位人的詳細內容。更多資訊請關注PHP中文網其他相關文章!