機器之能報道
編輯:楊文
誰能成為AI視訊圈的King? 美劇《權力的遊戲》中,有一把「鐵王座」。 傳說,它由巨龍「黑死神」熔掉上千把敵人丟棄的利劍鑄成,象徵無上的權威。為了坐上這張鐵椅,各大家族展開了一場場爭鬥和廝殺。 而自Sora 出現以來,AI 視訊圈也掀起了一場轟轟烈烈的「權力的遊戲」,這場遊戲的玩家主要有大洋彼岸的Runway Gen-3、Luma,國內的快手可靈、字節即夢、智譜清影、Vidu、PixVerse V2 等。
今天我們就來評測一下,看看究竟誰有資格登上 AI 視訊圈的「鐵王座」。
-1-
文生影片
目前,文生視訊功能已經是各家AI 視訊產品的「拿手好戲」,我們就把它當個開胃菜。
Prompt 1:The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor.鏡頭直接對著義大利布拉諾五顏六色的建築,一隻可愛的斑點狗從一樓的窗戶往外看。
可靈:
即夢:
清影:
清影:
🎜>PixVerse V2:
Luma:
各家都生成了五顏六色的建築,從運動幅度以及畫面的精美程度來看,Runway Gen-3 效果最佳,其次可靈和即夢也挺絲滑。Prompt 2:Nighttime footage of hermit crabs using light bulbs as shells.
中文提示詞2:寄居蟹用燈泡做殼的殼夜間鏡頭。 可靈:
即夢: 清影: Vidu:
PixVerse V2:
Luma:
Luma: 大部分影片中,要不是寄居蟹動幾下鉗子,就是搖鏡頭,相對而言, Vidu 和Runway Gen-3 的視訊運動幅度最大。 Vidu 生成的影片中,寄居蟹一溜煙都快跑沒影了, Runway Gen-3則展示了寄居蟹爬動的過程。Luma 的寄居蟹長得最奇怪,圓滾滾的,有點像滿地爬的蟑螂。
Prompt 3:The story of a robot's life in a cyberpunk setting.
中文提示詞3:
一個機器人在賽博朋克背景下的生活故事。可靈:
即夢:
清影:
Vidu:
PixVerse V2:
Runway Gen-3:
除了Luma 沒有出現像樣的機器人外,其他各家都展示了各自想像中的機器人形象。
可靈生成的視頻畫面,在構圖和鏡頭上神似Sora 放出來的“東京女子走在街頭”的示例;即夢的畫面最為精美和賽博朋克,而Vidu 則有種科幻片的即視感; PixVerse V2 的機器人最怪異,像頂了個水桶頭。
要說逼真程度以及運動幅度,Runway Gen-3 的效果似乎更勝一籌,當然它也有 bug,例如憑空出現並向後疾馳的汽車。
Prompt 4:The waves are lapping against the shells on the beach.
提示詞 4: 海浪拍打沙灘上的貝殼。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
Runway Gen-3:
整體來說,可靈和即夢生成的效果最真實,Luma 的貝殼看起來有點變形,最離譜的是PixVerse V2,一開始畫面還算正常,但眨眼功夫跑出來一個人,面部表情以及手部崩得沒眼看。
Prompt 5:
Cartoon style, a kangaroo is dancing提示詞 5: 卡通風格,一隻袋鼠在跳舞。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
Runway Gen-3:
AI 理解的動畫風格的袋鼠可像五花八門,有像老鼠的,也有像不明物種的。相較而言,可靈、Vidu 和 Runway Gen-3 效果較佳,起碼沒有大面積的模糊虛化。
-2-
圖生影片
這幾家號稱對標Sora 的影片產生模型也都上線了「圖生影片」功能,只要上傳一張圖片,輸入提示詞就可以讓靜態圖片動起來。
Round 1
上傳一張皮卡丘的圖片,輸入提示詞:皮卡丘開心地蹦起來(It jumps up happily)。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
PixVerse V2:
>Luma:
Runway Gen-3:
這輪現在Vidu 大勝,不只運動幅度大勝,表情、動作流暢,而且蹦跳的過程畫面沒垮;只是沒想到,這輪效果最差的是Runway Gen-3,各種稀奇古怪的變形。
Round 2上傳一張格蘭特・伍德著名的油畫《美國哥德式》,輸入提示字:兩個人笑了起來(They laugh)。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
PixVerse V2:
>Luma:Runway Gen-3:
從表情的自然程度來說,這把我選Runway Gen-3、可靈和Vidu,你覺得呢?
-3-
小編有話
Runway 不愧是AI 視訊圈的「扛把子」,Gen-3 著實能打,除了皮卡丘翻車以外,其他測試均表現不錯。 其次就是可靈,生成畫面比較穩定,對於提示詞的遵循也挺到位。 即夢對於顏色的駕馭最強,它產生的視訊顏色搭配最舒服,不足之處就是當動作幅度過大時,畫面容易模糊變形。 Vidu 的動畫效果最好,很擅長把動漫角色動態化這類活兒,而且生成速度快,生成一段 4 秒的影片只需 30 秒以上。 Luma,這個曾經讓全球網友瘋狂的整活工具,在此次實測中,相比於可靈和Runway Gen-3,它的表現並不突出,而且生成速度極慢,有時候一段5 秒的影片得花半個多小時,甚至更長。 從付費情況來看,目前除了 Runway Gen-3 需要完全付費外,其他各家都有免費體驗次數。其中智譜清影處於內測階段,可免費無限次生成。 為滿足不同用戶的需求,各家把會員分為基礎、標準和高級三種,價格都不便宜,按照年付來算,標價最貴的當屬Luma,基礎會員每年都需287.9 美元,這個價格在一眾應用中,可以說是一騎絕塵了。 你覺得哪一台AI影片產生能力最強?評論區聊聊吧。工具連結:
快手可靈:https://klingai.kuaishou.com/
位元組即夢:https://jimeng.jianying.com/ai-tool/home?activeTab=video&subTab=video
生數Vidu:https: //www.vidu.studio/
智譜清影:https://chatglm.cn/video
PixVerse:https: //pixverse.ai/
Luma:https://lumalabs.ai/dream-machine
Runway Gen-3:https: //runwayml.com/
以後我們會帶來更多AI大模型、AI應用的一手評測,也歡迎大家進群交流。
以上是實測7款「Sora級」影片生成神器,誰有本事登上「鐵王座」?的詳細內容。更多資訊請關注PHP中文網其他相關文章!