communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > Périphériques technologiques > IA > La diffusion vidéo stable est là ! La fonction de synthèse 3D attire l'attention des internautes : les progrès sont trop rapides

La diffusion vidéo stable est là ! La fonction de synthèse 3D attire l'attention des internautes : les progrès sont trop rapides

PHPz

Libérer： 2023-11-22 20:14:48

avant

949 Les gens l'ont consulté

Stable Video Diffusion a enfin commencé à traiter les vidéos -

publié le modèle vidéo génératif Stable Video Diffusion (SVD).

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Le blog officiel de Stability AI montre que le nouveau SVD prend en charge la génération de texte en vidéo et d'image en vidéo :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

et prend également en charge la conversion d'objets d'une perspective unique à plusieurs perspectives, c'est-à-dire la synthèse 3D. :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Selon une évaluation externe, les responsables affirment que SVD est encore plus populaire auprès des utilisateurs que Runway et l'IA de génération vidéo de Pika.

Bien que seul le modèle de base ait été publié jusqu'à présent, le responsable a révélé qu'"il prévoit de continuer à se développer et à établir un écosystème similaire à une diffusion stable"

Le grammage du code papier est actuellement en ligne.

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Récemment, de nouvelles méthodes ont vu le jour dans le domaine de la génération vidéo. C'est désormais au tour de Stable Diffusion d'apparaître, si bien que les internautes ont déploré "rapidement", de tels progrès sont trop rapides !

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Mais rien qu'à cause de l'effet démo, davantage d'internautes ont déclaré qu'ils n'étaient pas très surpris.

Bien que j'aime le SD, et ces démos sont géniales... mais il y a aussi quelques défauts, l'éclairage et les ombres sont faux, et l'incohérence globale

(scintillement entre les images vidéo).

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Dans l'ensemble, c'est le début. Les internautes sont très optimistes quant à la fonction de synthèse 3D de SVD :

Je peux vous garantir que quelque chose de mieux sortira bientôt. Il me suffit de le décrire brièvement pour le présenter. Une scène 3D complète

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

La version officielle de la vidéo SD arrive

En plus de ce qui est montré ci-dessus, le responsable a également publié plus de démos, jetons d'abord un coup d'œil :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Les promenades dans l'espace sont également programmé :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Vous pouvez également garder l'arrière-plan immobile et laisser uniquement les deux oiseaux bouger :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Le document de recherche sur SVD a également été publié. Selon les rapports, SVD est basé sur Stable Diffusion 2.1 et utilise. un ensemble de données vidéo d'environ 600 millions d'échantillons. Le modèle de base est pré-entraîné.

Facilement adaptable à une variété de tâches en aval, y compris la synthèse multi-vues à partir d'une seule image en affinant les ensembles de données multi-vues.

Après mise au point, deux modèles d'image en vidéo ont été officiellement annoncés. Ces modèles peuvent générer des vidéos de 14 images (SVD) et 25 images (SVD-XT) à des fréquences d'images personnalisées de 3 à 30 images par seconde en fonction des besoins de l'utilisateur

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Modèles de génération vidéo multi-vues affinés Enfin , nous l'avons nommé SVD-MV

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Selon les résultats des tests, sur l'ensemble de données GSO, SVD-MV a obtenu de meilleurs résultats que le modèle de génération multi-vue Zero123, Zero123XL, SyncDreamer :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Il convient de mentionner que Stability AI indique que SVD est actuellement limité à la recherche et ne convient pas aux applications pratiques ou commerciales. SVD n'est actuellement pas disponible pour tout le monde, mais l'inscription sur la liste d'attente des utilisateurs est ouverte.

La génération vidéo a explosé

Récemment, il y a eu un état de "mêlée" dans le domaine de la génération vidéo

Auparavant, il y avait Vincent Video AI développé par PikaLabs :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Plus tard, il y en a eu un autre appelé "la vidéo la plus puissante de l'histoire" Génération d'IAMoonvalleylancé :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Récemment, la fonction "Motion Brush" de Gen-2 a également été officiellement lancée, vous pouvez dessiner où vous voulez :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Maintenant, SVD est réapparu, et il y a un autre besoin. Il est possible de générer des vidéos 3D

Mais il ne semble pas y avoir beaucoup de progrès dans la génération de texte en 3D, et les internautes sont également très confus à propos de ce phénomène

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Certains. les gens pensent que les données sont le goulot d'étranglement qui entrave le développement :

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Certains internautes pensent que le problème est que la capacité d'apprentissage par renforcement n'est pas assez forte

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Connaissez-vous les derniers progrès dans ce domaine Bienvenue sur ? partager dans la zone de commentaires~

Lien papier : https://static1.squarespace .com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf Ce qu'il faut réécrire c'est :

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées：

ai 模型

Article précédent：Pour accueillir l'ère de l'informatique spatiale, la première conférence des développeurs Metaverse WMDC2023 s'ouvre à Shanghai Article suivant：La liste des « 30 meilleures entreprises urbaines innovantes du Metaverse en 2023 » a été annoncée et Baidu Xirang figurait sur la liste.

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Asfafasfasfasfasf

2025-02-28 14:37:10
Opinion impopulaire: elle est plus difficile que jamais pour être un bon scientifique des données

2025-02-26 03:55:10
Deepseek-V3 expliquée 1: Attention latente multi-tête

2025-02-26 03:00:17
Comment déployer facilement un moteur de recherche génératif local à l'aide de Verifai

2025-02-25 23:04:13
Comprendre l'évolution de Chatgpt: partie 2 & # 8211; GPT-2 et GPT-3

2025-02-25 21:02:11
Pourquoi la génération auprès de la récupération est toujours pertinente à l'ère des modèles de langage à long contexte

2025-02-25 19:31:14
Au-delà de la modélisation du langage causal

2025-02-25 18:28:09
Génération de données synthétiques avec LLMS

2025-02-25 16:54:10
Comment réinitialiser l'algorithme YouTube

2025-02-24 12:34:11
4 Utilisations intelligentes pour un vieux Mac

2025-02-24 12:29:09

Derniers numéros

8 outils populaires pour les applications de chiffon

2025-03-19 11:26:08
Guide de Jax rapide

2025-03-19 11:21:11
RAG AGENTIC pour analyser les problèmes des clients

2025-03-19 11:20:13
L'analyse des appels clients s'est rendue facile avec SnapSynapse

2025-03-19 11:17:15
3 stratégies avancées pour les retrievers à Langchain

2025-03-19 11:16:09

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal