WBOY
Freigeben: 2024-03-18 15:34:08
nach vorne
651 Leute haben es durchsucht

Bearbeitet |. Produziert von Yanzheng

|. 51CTO Technology Stack (WeChat ID: blog51cto)

Am 15. März starteten Tencent Hunyuan, die Tsinghua University und die Hong Kong University of Science and Technology gemeinsam ein neues Tusheng-Videomodell „Follow- Your-Click“, basierend auf dem Bild des Eingabemodells, klicken Sie einfach auf den entsprechenden Bereich und fügen Sie ein paar Eingabeaufforderungswörter hinzu, um den ursprünglich statischen Bereich im Bild zu verschieben und ihn mit einem Klick in ein Video umzuwandeln.

一键点、万物动! 腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”

Im aktuellen großen Tushita-Videomodell erfordert die allgemeine Generierungsmethode nicht nur, dass der Benutzer den Bewegungsbereich im Eingabeaufforderungswort beschreibt, sondern auch eine detaillierte Beschreibung der Bewegungsanweisungen , was ein komplizierter Prozess ist. Darüber hinaus mangelt es der vorhandenen Bilderzeugungsvideotechnologie an der Kontrolle über das Verschieben bestimmter Bildteile. Das erzeugte Video muss häufig die gesamte Szene und nicht nur einen bestimmten Bereich auf dem Bild verschieben und Flexibilität. Was fehlt.

Um diese Probleme zu lösen, schlug das gemeinsame Projektteam des Tencent Hunyuan Model Team, der Tsinghua University und der Hong Kong University of Science and Technology ein praktischeres und kontrollierbareres Bild-zu-Video-Generierungsmodell vor: Follow-Your-Click , um eine bequemere Interaktion zu ermöglichen, sodass „ein Klick und alles bewegt sich“ auf dem Bild.

一键点、万物动! 腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”

Die Technologie der Bild-zu-Video-Generierung hat breite Perspektiven für AIGC-Anwendungen in verschiedenen Branchen wie der Produktion von Filminhalten, Augmented Reality, Spieleproduktion und Werbung. Sie ist eine der heißesten KI-Technologien im Jahr 2024.

Es wird davon ausgegangen, dass das Tencent Hunyuan Large Model Team in diesem gemeinsamen Projektteam weiterhin multimodale Technologie erforscht und erforscht und über branchenführende Fähigkeiten zur Videogenerierung verfügt. Zuvor unterstützte Tencent Hunyuan Model als technischer Partner die „People's Daily“ bei der Erstellung des Originalvideos „So Many Beautiful Rivers and Mountains“, bei dem exquisite Videoclips von Chinas wunderschönen Flüssen und Bergen erstellt wurden, die ein ausgeprägtes inhaltliches Verständnis, logisches Denken usw. demonstrierten Bilder Generative Fähigkeit.

Papierlink: https://arxiv.org/abs/2403.08268

Github: https://follow-your-click.github.io/

Das obige ist der detaillierte Inhalt von. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage