机器之能报道
编辑:杨文
谁能成为AI视频圈的King?
美剧《权力的游戏》中,有一把「铁王座」。
传说,它由巨龙「黑死神」熔掉上千把敌人丢弃的利剑铸成,象征着无上的权威。为了坐上这把铁椅子,各大家族展开了一场场争斗和厮杀。
而自 Sora 出现以来,AI 视频圈也掀起了一场轰轰烈烈的「权力的游戏」,这场游戏的玩家主要有大洋彼岸的 Runway Gen-3、Luma,国内的快手可灵、字节即梦、智谱清影、Vidu、PixVerse V2 等。
今天我们就来测评一下,看看究竟谁有资格登上 AI 视频圈的「铁王座」。
-1-
文生视频
目前,文生视频功能已经是各家 AI 视频产品的「拿手好戏」,我们就把它当个开胃菜。
Prompt 1:The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor.
中文提示词 1:镜头直接对着意大利布拉诺五颜六色的建筑,一只可爱的斑点狗从一楼的窗户往外看。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
各家都生成了五颜六色的建筑,从运动幅度以及画面的精美程度来看,Runway Gen-3 效果最佳,其次可灵和即梦也挺丝滑。
Prompt 2:Nighttime footage of hermit crabs using light bulbs as shells.
中文提示词 2:寄居蟹用灯泡做壳的夜间镜头。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
大部分视频中,要么是寄居蟹动几下钳子,要么就是摇镜头,相对而言, Vidu 和 Runway Gen-3 的视频运动幅度最大。Vidu 生成的视频中,寄居蟹一溜烟都快跑没影了, Runway Gen-3则展示了寄居蟹爬动的过程。
Luma 的寄居蟹长得最奇怪,圆滚滚的,有点像满地爬的蟑螂。
Prompt 3:The story of a robot’s life in a cyberpunk setting.
中文提示词 3:一个机器人在赛博朋克背景下的生活故事。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
除了 Luma 没有出现像样的机器人外,其他各家都展示了各自想象中的机器人形象。
可灵生成的视频画面,在构图和镜头上神似 Sora 放出来的「东京女子走在街头」的示例;即梦的画面最为精美和赛博朋克,而 Vidu 则有种科幻片的即视感; PixVerse V2 的机器人最怪异,像顶了个水桶脑袋。
要说逼真程度以及运动幅度,Runway Gen-3 的效果似乎更胜一筹,当然它也有 bug,比如凭空出现并向后疾驰的汽车。
Prompt 4:The waves are lapping against the shells on the beach.
提示词 4: 海浪拍打着沙滩上的贝壳。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
整体来说,可灵和即梦生成的效果最真实,Luma 的贝壳看起来有点变形,最离谱的是 PixVerse V2,一开始画面还算正常,但眨眼功夫跑出来一个人,面部表情以及手部崩得没眼看。
Prompt 5:Cartoon style, a kangaroo is dancing
Aufforderungswort 5:Cartoon-Stil, ein Känguru tanzt.
Keling:
Instant Dream:
Qingying:
Vidu:
PixVerse V2:
Luma:
Runway Gen -3 :
AI versteht, dass die Kängurus im Anime-Stil wirklich vielfältig sind, einige sehen aus wie Mäuse und andere wie unbekannte Arten. Im Vergleich haben Coring, Vidu und Runway Gen-3 bessere Effekte, zumindest gibt es keine großflächigen Unschärfen.
-2-
TuSheng Video
Diese Videogenerierungsmodelle, die behaupten, der Maßstab für Sora zu sein, haben auch die Funktion „TuSheng Video“ eingeführt. Sie müssen nur ein Bild hochladen und das Eingabeaufforderungswort eingeben . Kann statische Bilder bewegen.
Runde 1
Laden Sie ein Bild von Pikachu hoch und geben Sie das Aufforderungswort ein: Pikachu springt glücklich auf (Es springt glücklich auf).
Keling:
Real Dream:
Qingying:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
Vidu hatte nicht nur einen großen Bewegungsumfang, sanfte Ausdrücke und Bewegungen, auch der Bildschirm brach während des Sprungvorgangs nicht zusammen. Aber das Schlimmste hatte ich nicht erwartet Der Effekt in dieser Runde war Runway Gen-3. Alle möglichen seltsamen Transformationen.
Runde 2
Laden Sie ein berühmtes Ölgemälde „American Gothic“ von Grant Wood hoch und geben Sie das Aufforderungswort ein: Sie lachen.
Keling:
Real Dream:
Qingying:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
Aus der Perspektive des natürlichen Ausdrucks wähle ich hier Runway Gen-3, Keling und Vidu, was denken Sie?
-3-
Der Redakteur hat etwas zu sagen
Runway ist es wert, der „Hands-on“ im KI-Videokreis zu sein Bis auf das Umkippen von Pikachu schnitten alle anderen Tests gut ab.
Der zweite ist Ke Ling, der relativ stabile Bilder erzeugt und prompten Worten recht gut folgt.
Jimeng hat die stärkste Kontrolle über die Farbe und die Farbanpassung der von ihm generierten Videos ist am komfortabelsten. Der Nachteil besteht darin, dass das Bild leicht unscharf und deformiert wird, wenn der Bewegungsbereich zu groß ist.
Vidu hat den besten Animationseffekt. Es ist sehr gut darin, Animationsfiguren dynamisch zu gestalten und die Generierungsgeschwindigkeit ist hoch. Die Erstellung eines 4-Sekunden-Videos dauert nur mehr als 30 Sekunden.
Luma, dieses lebende Tool, das einst Internetnutzer auf der ganzen Welt verrückt gemacht hat, ist in diesem tatsächlichen Test im Vergleich zu Keling und Runway Gen-3 nicht herausragend und die Generierungsgeschwindigkeit ist manchmal extrem langsam (5 A). Das zweite Video würde mehr als eine halbe Stunde oder sogar länger dauern.
Was die Bezahlung anbelangt, haben alle anderen derzeit mit Ausnahme von Runway Gen-3, für das eine vollständige Zahlung erforderlich ist, kostenlose Testzeiten. Unter anderem befindet sich Zhipu Qingying in der internen Testphase und kann unbegrenzt oft kostenlos generiert werden.
Um den Bedürfnissen verschiedener Benutzer gerecht zu werden, unterteilt jedes Unternehmen die Mitgliedschaft in drei Arten: Basic, Standard und Advanced. Die Preise werden auf der Grundlage der jährlichen Zahlung berechnet, die teuerste ist die Mitgliedschaft bei Luma Mit 287,9 US-Dollar kann man sagen, dass dieser Preis unter vielen Anwendungen beispiellos ist.
Welches Unternehmen verfügt Ihrer Meinung nach über die stärkste Fähigkeit zur KI-Videogenerierung? Lassen Sie uns im Kommentarbereich chatten.
Tool-Link:
Kuaishou Keling: https://klingai.kuaishou.com/
Byte Dream: https://jimeng.jianying.com/ai-tool/home ?activeTab= video&subTab=video
生生Vidu: https://www.vidu.studio/
智典清影: https://chatglm.cn/video
PixVerse: https: //pixverse.ai /
Luma: https://lumalabs.ai/dream-machine
Runway Gen-3: https://runwayml.com/
Wir werden in Zukunft mehr bringen. Wir heißen auch alle willkommen der Gruppe beizutreten, um mehrere große KI-Modelle und KI-Anwendungen aus erster Hand zu bewerten.
以上是实测7款「Sora级」视频生成神器,谁有本事登上「铁王座」?的详细内容。更多信息请关注PHP中文网其他相关文章!