Table des matières
Aperçu de la méthode
Maison Périphériques technologiques IA Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Apr 12, 2023 pm 08:10 PM
视频 图像

Nous savons que les progrès des modèles génératifs et des modèles de langage visuel multimodal ont ouvert la voie à des modèles texte-image à grande échelle dotés d'un réalisme et d'une diversité génératifs sans précédent. Ces modèles offrent de nouveaux processus créatifs, mais se limitent à composer de nouvelles images plutôt qu'à éditer des images existantes. Pour combler cette lacune, des méthodes intuitives d'édition textuelle permettent l'édition textuelle d'images générées et réelles et préservent certaines des propriétés originales de ces images. Semblables aux images, de nombreux modèles de conversion texte-vidéo ont été proposés récemment, mais il existe peu de méthodes utilisant ces modèles pour le montage vidéo. ​

Dans le montage vidéo guidé par texte, l'utilisateur fournit une vidéo d'entrée ainsi qu'une invite de texte décrivant les propriétés attendues de la vidéo générée, comme le montre la figure 1 ci-dessous. Les objectifs comportent les trois aspects suivants : 1) Alignement, la vidéo éditée doit être conforme à l'invite de texte de saisie ; 2) Fidélité, la vidéo éditée doit conserver le contenu de la vidéo originale, 3) Qualité, la vidéo éditée doit être de haute qualité. .

Comme vous pouvez le constater, le montage vidéo est plus difficile que le montage d'images, il nécessite de synthétiser de nouvelles actions plutôt que de simplement modifier l'apparence visuelle. Il est également nécessaire de maintenir une cohérence temporelle. Par conséquent, l’application de méthodes d’édition au niveau de l’image telles que SDEdit et Prompt-to-Prompt aux images vidéo ne suffit pas pour obtenir de bons résultats.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Dans un article récemment publié sur arXiv par Google Research et d'autres, des chercheurs ont proposé une nouvelle méthode Dreamix, inspirée par UniTune pour diffuser des vidéos conditionnelles au texte Model (modèle de diffusion vidéo, VDM) est appliqué au montage vidéo.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

  • Adresse de papier: https://arxiv.org/pdf/2302.01329.pdf
  • project Homepage: https: //dreamix-videoo-editing.github. io/

Le cœur de la méthode dans cet article est de faire en sorte que le texte conditionnel VDM maintienne une haute fidélité à la vidéo d'entrée grâce aux deux idées principales suivantes. L'une n'utilise pas de bruit pur comme initialisation du modèle, mais utilise une version dégradée de la vidéo originale pour conserver uniquement de faibles informations spatio-temporelles en réduisant la taille et en ajoutant du bruit ; modèle génératif sur la vidéo originale Spend.

Le réglage fin garantit que le modèle comprend les propriétés haute résolution de la vidéo originale. Un simple réglage fin de la vidéo d'entrée contribue à une édition de mouvement relativement faible, car le modèle apprend à préférer le mouvement brut plutôt que de suivre les invites textuelles. Nous proposons une nouvelle méthode de réglage hybride dans laquelle le VDM est également affiné sur un ensemble d'images individuelles de la vidéo d'entrée et ignore leur synchronisation. Le réglage fin du mélange améliore considérablement la qualité de l’édition de mouvement.

Les chercheurs ont ensuite utilisé leur modèle de montage vidéo pour proposer un

nouveau cadre d'animation d'images, comme le montre la figure 2 ci-dessous. Le cadre comprend plusieurs étapes, telles que l'animation d'objets et d'arrière-plans dans des images, la création de mouvements de caméra dynamiques, etc. Pour ce faire, ils effectuent de simples opérations de traitement d'image telles que la copie d'images ou la transformation géométrique d'images, créant ainsi des vidéos grossières. Utilisez ensuite l'éditeur vidéo Dreamix pour éditer la vidéo. En outre, les chercheurs ont également utilisé leur méthode de réglage fin pour la génération vidéo axée sur les objectifs, à savoir la version vidéo de Dreambooth.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Dans la partie d'affichage expérimental, les chercheurs ont mené des recherches qualitatives approfondies et une évaluation manuelle pour démontrer les puissantes capacités de leur méthode. Veuillez vous référer à l'animation suivante pour plus de détails.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Concernant cette étude de Google, certains disent que les outils de mouvement et d'édition 3D+ pourraient être des sujets populaires pour la prochaine vague d'articles.

Quelqu'un d'autre a dit : Vous pourrez bientôt réaliser votre propre film avec un budget limité, tout ce dont vous avez besoin c'est d'un écran vert et de cette technologie :

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Aperçu de la méthode

Cet article propose une nouvelle méthode de montage vidéo, plus précisément :

Montage vidéo guidé par texte par rétro-ingénierie de vidéos corrompues

Ils adoptent des VDM (modèles de diffusion vidéo) en cascade, d'abord par sous-échantillonnage qui détruit dans une certaine mesure la vidéo d'entrée puis ajoute du bruit. Ensuite, un modèle de diffusion en cascade est utilisé pour le processus d'échantillonnage et conditionné au temps t pour mettre à l'échelle la vidéo jusqu'à la résolution spatio-temporelle finale. ​

Dans le processus de destruction de la vidéo d'entrée, vous devez d'abord effectuer une opération de sous-échantillonnage pour obtenir le modèle de base (16 images 24 × 40), puis ajouter du bruit gaussien avec une variance de Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films pour plus Détruisez la vidéo d'entrée. ​

Pour la vidéo traitée ci-dessus, l'étape suivante consiste à utiliser VDM en cascade pour mapper la vidéo basse résolution corrompue sur une vidéo haute résolution alignée sur le texte. L’idée centrale ici est que, étant donné une vidéo bruitée, à très faible résolution temporelle et spatiale, il existe de nombreuses vidéos parfaitement réalisables à haute résolution qui lui correspondent. Le modèle de base de cet article part d'une vidéo corrompue, qui a le même bruit que le processus de diffusion au temps s. L’étude a ensuite utilisé le VDM pour inverser le processus de diffusion jusqu’au temps 0. Enfin, la vidéo est mise à niveau grâce au modèle super-résolution.

Réglage fin de l'image vidéo hybride

L'utilisation uniquement de la vidéo d'entrée pour affiner le modèle de diffusion vidéo limitera les changements de mouvement de l'objet. Au lieu de cela, cette étude a utilisé une cible hybride, c'est-à-dire en plus. à la cible d'origine (coin inférieur gauche) De plus, cet article affine également les ensembles d'images non ordonnés, ce qui se fait via une « attention temporelle masquée » pour empêcher l'attention temporelle et la convolution d'être affinées (en bas à droite). Cette opération permet d'ajouter du mouvement aux vidéos statiques.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Inférence

Basée sur le prétraitement de l'application (prétraitement dépendant de l'application, image de gauche ci-dessous), cette recherche prend en charge une variété d'applications et peut convertir le contenu d'entrée en vidéo unifiée. format. Pour la conversion image-vidéo, l'image d'entrée est copiée et transformée, synthétisant une vidéo brute avec un certain mouvement de caméra ; pour la génération vidéo pilotée par objet, son entrée est omise et affinée séparément pour maintenir la fidélité. Cette vidéo brute est ensuite montée à l'aide de Dreamix Video Editor (à droite) : comme mentionné précédemment, la vidéo est d'abord détruite par sous-échantillonnage, ajoutant du bruit. Un modèle de diffusion vidéo guidé par texte est ensuite appliqué pour mettre à l'échelle la vidéo jusqu'à sa résolution temporelle et spatiale finale.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Résultats expérimentaux

Montage vidéo : dans l'image ci-dessous, Dreamix a changé l'action en danse et l'apparence de singe en ours, mais les attributs de base du sujet dans la vidéo n'ont pas changé :

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films


Dreamix peut également générer des modifications visuelles fluides qui sont cohérentes avec les informations temporelles de la vidéo d'entrée, comme la figure suivante d'un cerf en train de faire du skateboard :

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Image vers la vidéo : Lorsque le l'entrée est une image Dreamix peut utiliser ses priorités vidéo pour ajouter de nouveaux objets en mouvement, comme l'image ci-dessous où une licorne apparaît dans une forêt brumeuse et effectue un zoom avant.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Pingouins apparaissant à côté de la cabane :

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Génération de vidéo axée sur un objectif : Dreamix peut également prendre une collection d'images montrant le même thème et générer une nouvelle vidéo avec celle-ci. thème pour les objets en mouvement. L'image ci-dessous montre une chenille se tortillant sur une feuille :

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

En plus de l'analyse qualitative, l'étude a également mené une comparaison de base, comparant principalement Dreamix avec Imagen-Video et Plug-and-Play (PnP). méthode de comparaison. Le tableau suivant montre les résultats de notation :

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

La figure 8 montre une vidéo éditée par Dreamix et deux exemples de base : Le modèle texte-vidéo permet un montage basse fidélité car il n'utilise pas la vidéo originale comme condition. PnP préserve la scène mais manque de cohérence d'une image à l'autre ; Dreamix fonctionne bien sur les trois objectifs.

Google est le premier à lancer la génération vidéo AIGC, internautes : vous pouvez personnaliser les films

Veuillez vous référer au document original pour plus de détails techniques.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Où sont stockés les fichiers vidéo dans le cache du navigateur ? Où sont stockés les fichiers vidéo dans le cache du navigateur ? Feb 19, 2024 pm 05:09 PM

Dans quel dossier le navigateur met-il la vidéo en cache ? Lorsque nous utilisons le navigateur Internet quotidiennement, nous regardons souvent diverses vidéos en ligne, comme regarder des clips vidéo sur YouTube ou regarder des films sur Netflix. Ces vidéos seront mises en cache par le navigateur pendant le processus de chargement afin qu'elles puissent être chargées rapidement lors d'une nouvelle lecture ultérieure. La question est donc de savoir dans quel dossier ces vidéos mises en cache sont réellement stockées ? Différents navigateurs stockent les dossiers vidéo mis en cache à différents emplacements. Ci-dessous, nous présenterons plusieurs navigateurs courants et leurs

Est-ce une infraction de publier des vidéos d'autres personnes sur Douyin ? Comment éditer des vidéos sans infraction ? Est-ce une infraction de publier des vidéos d'autres personnes sur Douyin ? Comment éditer des vidéos sans infraction ? Mar 21, 2024 pm 05:57 PM

Avec l'essor des plateformes de vidéos courtes, Douyin est devenu un élément indispensable de la vie quotidienne de chacun. Sur TikTok, nous pouvons voir des vidéos intéressantes du monde entier. Certaines personnes aiment publier les vidéos d’autres personnes, ce qui soulève une question : Douyin enfreint-il la publication de vidéos d’autres personnes ? Cet article abordera ce problème et vous expliquera comment éditer des vidéos sans infraction et comment éviter les problèmes d'infraction. 1. Cela porte-t-il atteinte à la publication par Douyin de vidéos d'autres personnes ? Selon les dispositions de la loi sur le droit d'auteur de mon pays, l'utilisation non autorisée des œuvres du titulaire du droit d'auteur sans l'autorisation du titulaire du droit d'auteur constitue une infraction. Par conséquent, publier des vidéos d’autres personnes sur Douyin sans l’autorisation de l’auteur original ou du titulaire des droits d’auteur constitue une infraction. 2. Comment monter une vidéo sans contrefaçon ? 1. Utilisation de contenu du domaine public ou sous licence : Public

Comment supprimer le filigrane vidéo dans Wink Comment supprimer le filigrane vidéo dans Wink Feb 23, 2024 pm 07:22 PM

Comment supprimer les filigranes des vidéos dans Wink ? Il existe un outil pour supprimer les filigranes des vidéos dans winkAPP, mais la plupart des amis ne savent pas comment supprimer les filigranes des vidéos dans Wink. Voici ensuite l'image de la façon de supprimer les filigranes des vidéos dans Wink. apporté par l'éditeur Tutoriel texte, les utilisateurs intéressés viennent y jeter un oeil ! Comment supprimer le filigrane vidéo dans Wink 1. Ouvrez d'abord l'application Wink et sélectionnez la fonction [Supprimer le filigrane] dans la zone de la page d'accueil ; 2. Sélectionnez ensuite la vidéo dont vous souhaitez supprimer le filigrane dans l'album ; dans le coin supérieur droit après avoir édité la vidéo [√] ; 4. Enfin, cliquez sur [Imprimer en un clic] comme indiqué dans la figure ci-dessous, puis cliquez sur [Traiter].

Comment gagner de l'argent en publiant des vidéos sur Douyin ? Comment un débutant peut-il gagner de l'argent sur Douyin ? Comment gagner de l'argent en publiant des vidéos sur Douyin ? Comment un débutant peut-il gagner de l'argent sur Douyin ? Mar 21, 2024 pm 08:17 PM

Douyin, la plateforme nationale de courtes vidéos, nous permet non seulement de profiter d'une variété de courtes vidéos intéressantes et originales pendant notre temps libre, mais nous donne également une scène pour nous montrer et réaliser nos valeurs. Alors, comment gagner de l’argent en postant des vidéos sur Douyin ? Cet article répondra à cette question en détail et vous aidera à gagner plus d’argent sur TikTok. 1. Comment gagner de l’argent en publiant des vidéos sur Douyin ? Après avoir posté une vidéo et obtenu un certain nombre de vues sur Douyin, vous aurez la possibilité de participer au plan de partage publicitaire. Cette méthode de revenus est l’une des plus connues des utilisateurs de Douyin et constitue également la principale source de revenus pour de nombreux créateurs. Douyin décide d'offrir ou non des opportunités de partage de publicités en fonction de divers facteurs tels que le poids du compte, le contenu vidéo et les commentaires du public. La plateforme TikTok permet aux téléspectateurs de soutenir leurs créateurs préférés en envoyant des cadeaux,

2 façons de supprimer le ralenti des vidéos sur iPhone 2 façons de supprimer le ralenti des vidéos sur iPhone Mar 04, 2024 am 10:46 AM

Sur les appareils iOS, l'application Appareil photo vous permet de filmer des vidéos au ralenti, voire à 240 images par seconde si vous possédez le dernier iPhone. Cette capacité vous permet de capturer une action à grande vitesse avec des détails riches. Mais parfois, vous souhaiterez peut-être lire des vidéos au ralenti à vitesse normale afin de mieux apprécier les détails et l'action de la vidéo. Dans cet article, nous expliquerons toutes les méthodes pour supprimer le ralenti des vidéos existantes sur iPhone. Comment supprimer le ralenti des vidéos sur iPhone [2 méthodes] Vous pouvez utiliser l'application Photos ou l'application iMovie pour supprimer le ralenti des vidéos sur votre appareil. Méthode 1 : ouvrir sur iPhone à l’aide de l’application Photos

Comment publier les œuvres vidéo de Xiaohongshu ? À quoi dois-je faire attention lorsque je publie des vidéos ? Comment publier les œuvres vidéo de Xiaohongshu ? À quoi dois-je faire attention lorsque je publie des vidéos ? Mar 23, 2024 pm 08:50 PM

Avec l'essor des plateformes de vidéos courtes, Xiaohongshu est devenue une plateforme permettant à de nombreuses personnes de partager leur vie, de s'exprimer et de gagner du trafic. Sur cette plateforme, la publication d’œuvres vidéo est un moyen d’interaction très prisé. Alors, comment publier les œuvres vidéo de Xiaohongshu ? 1. Comment publier les œuvres vidéo de Xiaohongshu ? Tout d’abord, assurez-vous d’avoir un contenu vidéo prêt à partager. Vous pouvez utiliser votre téléphone portable ou un autre équipement photo pour prendre des photos, mais vous devez faire attention à la qualité de l'image et à la clarté du son. 2. Editer la vidéo : Afin de rendre le travail plus attrayant, vous pouvez éditer la vidéo. Vous pouvez utiliser un logiciel de montage vidéo professionnel, tel que Douyin, Kuaishou, etc., pour ajouter des filtres, de la musique, des sous-titres et d'autres éléments. 3. Choisissez une couverture : La couverture est la clé pour inciter les utilisateurs à cliquer. Choisissez une image claire et intéressante comme couverture pour inciter les utilisateurs à cliquer dessus.

Comment publier des vidéos sur Weibo sans compresser la qualité de l'image_Comment publier des vidéos sur Weibo sans compresser la qualité de l'image Comment publier des vidéos sur Weibo sans compresser la qualité de l'image_Comment publier des vidéos sur Weibo sans compresser la qualité de l'image Mar 30, 2024 pm 12:26 PM

1. Ouvrez d'abord Weibo sur votre téléphone mobile et cliquez sur [Moi] dans le coin inférieur droit (comme indiqué sur l'image). 2. Cliquez ensuite sur [Gear] dans le coin supérieur droit pour ouvrir les paramètres (comme indiqué sur l'image). 3. Ensuite, recherchez et ouvrez [Paramètres généraux] (comme indiqué sur l'image). 4. Entrez ensuite l'option [Video Follow] (comme indiqué sur l'image). 5. Ensuite, ouvrez le paramètre [Résolution de téléchargement vidéo] (comme indiqué sur l'image). 6. Enfin, sélectionnez [Qualité d'image originale] pour éviter la compression (comme indiqué sur l'image).

Comment convertir des vidéos téléchargées par le navigateur UC en vidéos locales Comment convertir des vidéos téléchargées par le navigateur UC en vidéos locales Feb 29, 2024 pm 10:19 PM

Comment transformer les vidéos téléchargées par le navigateur UC en vidéos locales ? De nombreux utilisateurs de téléphones mobiles aiment utiliser UC Browser. Ils peuvent non seulement naviguer sur le Web, mais également regarder diverses vidéos et programmes télévisés en ligne et télécharger leurs vidéos préférées sur leurs téléphones mobiles. En fait, nous pouvons convertir des vidéos téléchargées en vidéos locales, mais beaucoup de gens ne savent pas comment le faire. Par conséquent, l'éditeur vous propose spécialement une méthode pour convertir les vidéos mises en cache par le navigateur UC en vidéos locales. J'espère que cela pourra vous aider. Méthode pour convertir les vidéos mises en cache du navigateur uc en vidéos locales 1. Ouvrez le navigateur uc et cliquez sur l'option "Menu". 2. Cliquez sur « Télécharger/Vidéo ». 3. Cliquez sur « Vidéo mise en cache ». 4. Appuyez longuement sur n'importe quelle vidéo, lorsque les options apparaissent, cliquez sur « Ouvrir le répertoire ». 5. Cochez ceux que vous souhaitez télécharger

See all articles