プロンプトの単語を入力します:画家と娘の肖像画、しっかりと抱き合う母と娘。
Tusheng のビデオに加えて、Vincent のビデオもあります。朵 ヒント: 黒い背景に 2 つの花がゆっくりと咲き、繊細な花びらとおしべが見えます。 说实话,这画风有宫崎骏老爷子的味道。Vidu 读懂了提示词,小女孩切菜动作一气呵成,就是手指和刀具在不经意间仍有变形。 在 DiT 论文发布两个月前,清华大学的朱军团队提交了一篇论文 ——《All are Worth Words: A ViT Backbone for Diffusion Models》。这篇论文提出了用 Transformer 替代基于 CNN 的 U-Net 的网络架构 U-ViT。这是「Vidu」最重要的技术基础。 参考链接:《当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律》
《专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型》
《国内公司有望做出Sora吗?这支清华系大模型团队给出了希望》
以上がもう一つの「国内版Sora」がグローバルに登場! Tsinghua Zhu Jun の起業家チーム、ビデオ生成にかかる時間はわずか 30 秒の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。