魔搭社群上線AI影片產生工具Live Portait,可一鍵讓照片開口說話
魔搭社群推出了一款名為Live Portrait的AI影片產生工具,能夠透過一鍵操作讓照片中的人物開口說話
阿里雲推出了一個名為Live Portrait的數位人影片產生工具,用戶只需上傳一張照片和一段文字或語音,即可產生一段開口說話的數位人影片。這項工具可應用於視訊直播、聊天機器人、企業行銷等多個場景。目前,該工具已在魔搭社群創空間開放體驗
隨著自對話大模型和AI繪畫模型的風靡,研究界正逐漸將生成式AI的研究推向更多模態的方向,其中AI視頻生成技術備受關注。該技術能夠將文字或音訊等資訊轉化為臉部運動訊息,從而產生具有人物形象的動畫照片,有效降低了影片拍攝和製作的門檻
阿里雲最新上線的Live Portait工具,結合了運動模組和生成模組。該工具採用了阿里雲自研的口型預測演算法,大幅提高了口型生成的準確度,相較於傳統方法有顯著提升。在訓練階段,增加了姿態的顯式控制,使得生成的視頻可以呈現任意動作,無需底板視頻,從而大幅提升了數字人說話的真實感。此外,透過眼神主動控制技術,Live Portait可以為眼球增加自然運動,使得生成結果更接近真人效果。據介紹,Live Portait相關技術已被國際AI頂會CVPR、ICCV等收錄
根據魔搭社群的訊息,Live Portait提供了兩種方式供用戶選擇上傳照片後,即文字驅動和音訊驅動。在文字驅動模式下,使用者可以選擇28種不同的聲音,包括國語、英語、粵語和童聲等。此外,Live Portait還提供了輕量模型選擇,以幫助用戶更快地生成影片
張邦,工具演算法負責人,表示:「Live Portait整合了團隊多項自主研發的創新技術,包括利用單張圖片即可生成逼真的臉部動畫,突破了傳統對抗生成網路的限制。隨著技術的不斷演進,影像生成影片具有廣闊的應用前景,有望成為企業提高生產效率、降低成本的重要工具。」
據了解,團隊的研究方向包括數位人、3D模型AI生成、高逼真渲染和自然人機互動等領域,已經在國際頂尖會議上發表了50多篇論文
以上是魔搭社群上線AI影片產生工具Live Portait,可一鍵讓照片開口說話的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

Vibe編碼通過讓我們使用自然語言而不是無盡的代碼行創建應用程序來重塑軟件開發的世界。受Andrej Karpathy等有遠見的人的啟發,這種創新的方法使Dev

2025年2月,Generative AI又是一個改變遊戲規則的月份,為我們帶來了一些最令人期待的模型升級和開創性的新功能。從Xai的Grok 3和Anthropic的Claude 3.7十四行詩到Openai的G

Yolo(您只看一次)一直是領先的實時對象檢測框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了進步,可顯著提高準確性

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

Chatgpt 4當前可用並廣泛使用,與諸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和產生連貫的響應方面取得了重大改進。未來的發展可能包括更多個性化的間

本文討論了AI模型超過Chatgpt,例如Lamda,Llama和Grok,突出了它們在準確性,理解和行業影響方面的優勢。(159個字符)

MISTRAL OCR:通過多模式文檔理解徹底改變檢索效果 檢索增強的生成(RAG)系統具有明顯高級的AI功能,從而可以訪問大量的數據存儲,以獲得更明智的響應

文章討論了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的寫作助手,重點介紹了其獨特的內容創建功能。它認為Jasper在SEO優化方面表現出色,而AI工具有助於保持音調的組成
