IT之家 6 月 9 日消息,北京百度網訊科技有限公司申請的「產生數位人的方法、模型的訓練方法、裝置、設備和介質」專利獲授權。
IT之家從專利摘要獲取到,該專利提供了一種生成數位人的方法、模型的訓練方法、裝置、設備和介質,涉及人工智慧領域,具體涉及自然語言處理、深度學習、計算機視覺、影像處理、擴增實境和虛擬實境等技術領域,可應用於元宇宙等場景。實現方案為:取得素材內容;基於預先訓練的場景劃分模型,從素材內容中確定多個場景。
其中,多個場景中的每個場景分別對應於素材內容中的一個具有完整語義資訊的內容片段;以及對於多個場景中的每個場景,基於對應的內容片段,確定該場景對應的目標內容;基於對應的目標內容,確定該場景的場景標籤資訊;以及基於場景標籤訊息,配置特定於該場景的數字人。
專利稱,數位人在影片中的運用主要基於模板進行,例如固定數位人進行播報,數位人播報時可能會出現數位人與內容割裂,播報內容與數位人形像不匹配,使用者體驗差。
該專利透過對素材內容進行場景切分,並以場景為粒度進行數位人的配置,從而確保了數位人與場景和目標內容的一致性,改善了素材內容和數位人之間的融合,提升了使用者觀看數位人的體驗。
以上是百度「根據場景產生數位人」專利獲授權,可應用於元宇宙的詳細內容。更多資訊請關注PHP中文網其他相關文章!