穩定AI發布穩定視頻擴散模型,根據圖像生成視頻
IT之家 11 月 22 日消息,專注於開發人工智慧(AI)產品的新創公司 Stability AI 發布了其最新的 AI 模型 ——Stable Video Diffusion。這款模型能夠透過現有圖片生成視頻,是基於先前發布的 Stable Diffusion 文本轉圖片模型的延伸,也是目前為止市面上少有的能夠生成視頻的 AI 模型之一。
不過,這款模型目前並不是對所有人開放的。 Stable Video Diffusion 目前處於 Stability AI 所謂的「研究預覽」階段。想要使用這款模型的人必須同意一些使用條款,其中規定了Stable Video Diffusion 的預期應用場景(例如“教育或創意工具”、“設計和其他藝術過程”等)和非預期的場景(例如“對人或事件的事實或真實的表達」)。
穩定視訊擴散實際上由兩個模型組成—SVD和SVD-XT。 SVD可以將靜態圖片轉換為14幀的576×1024像素影片。 SVD-XT採用相同的結構,但幀數提高到24。兩者都能以每秒3到30幀的速度產生影片
根據Stability AI 隨Stable Video Diffusion 一起發布的一篇白皮書,SVD 和SVD-XT 最初是在一個包含數百萬視頻的數據集上進行訓練的,然後在一個規模較小的數據集上進行了“微調”,這個資料集只有幾十萬到一百萬左右的影片片段。這些影片的來源並不十分清楚,白皮書暗示許多是來自公開的研究資料集,所以無法判斷是否有任何版權問題。
SVD和SVD-XT均能夠產生高品質的四秒視頻,從Stability AI部落格上精心挑選的樣本來看,其品質可以與Meta最新的視頻生成模型、谷歌、AI新創公司Runway和Pika Labs的AI生成影片相媲美
IT之家注意到,穩定視訊擴散也有限制。 Stability AI對此也非常坦誠,他們稱這些模型不能生成沒有運動或緩慢攝像機平移的視頻,也不能通過文本進行控制,也不能渲染文字(至少不能清晰地渲染),也不能一致地“正確地”生成人臉和人物
儘管處於早期階段,Stability AI指出這些模型具有很高的擴展性,可以適應生成物體的360度視圖等各種用例
Stability AI 最終的目標似乎是將其商業化,並表示 Stable Video Diffusion 在「廣告、教育、娛樂等領域」都有潛在的應用。
以上是穩定AI發布穩定視頻擴散模型,根據圖像生成視頻的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

本文比較了諸如Chatgpt,Gemini和Claude之類的頂級AI聊天機器人,重點介紹了其獨特功能,自定義選項以及自然語言處理和可靠性的性能。

文章討論了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的寫作助手,重點介紹了其獨特的內容創建功能。它認為Jasper在SEO優化方面表現出色,而AI工具有助於保持音調的組成

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

2024年見證了從簡單地使用LLM進行內容生成的轉變,轉變為了解其內部工作。 這種探索導致了AI代理的發現 - 自主系統處理任務和最少人工干預的決策。 Buildin

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

本文評論了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高級AI語音生成器,重點介紹其功能,語音質量和滿足不同需求的適用性。
