Ces derniers jours, la guerre des moteurs de recherche déclenchée par ChatGPT a fait des étincelles entre Google et Microsoft.
Même si l'on regarde de loin, on sent profondément que cet engouement pour l'AIGC risque de changer à jamais le fonctionnement de la société humaine.
Hier, la deuxième phase de New Smart Talk sur le thème « Generative AI Explosion » a été officiellement lancée.
New Wisdom Talk est animé par Mme Yang Jing, fondatrice de New Wisdom. L'invité de ce numéro est He Zhan, responsable d'Omnverse, NVIDIA Chine.
Après que les hôtes et les invités se soient réjouis les uns après les autres, le nouvel épisode de New Wise Talk a enfin commencé l'enregistrement. Le thème de ce numéro est "Generative AI Explosion".
En fait, lors de la préparation du programme, l'IA générative a traversé plusieurs générations d'itérations et d'évolution. On peut dire que sa vitesse d'évolution est plus rapide que la vitesse de préparation du programme. programme.
En 2022, tout comme nous, les humains, évoluons, l'IA évolue également tranquillement. Par conséquent, 2022 est devenue l'année de l'explosion de l'IA générative.
Il y a deux choses qui peuvent pleinement prouver la popularité de l'IA générative.
Par exemple, l'œuvre "Kill That Shijiazhuang Man" du célèbre groupe de rock national Wanmen Youth Hostel est soudainement devenue populaire sur la station B. La raison en est que chacune de ses paroles a été associée à des images par l’IA.
Une autre chose qui devrait être familière à beaucoup de gens. Un concepteur de jeux américain a utilisé l'IA pour dessiner un tableau, puis a utilisé le tableau pour participer à un concours d'art et a en fait remporté la première place. C’est aussi la première fois dans l’histoire que l’IA bat les humains dans l’art.
De même, la forte itération de NVIDIA Omniverse reflète également cela. Désormais, les utilisateurs peuvent facilement utiliser la numérisation pour créer des jumeaux numériques et des personnes numériques virtuelles, ce qui constitue une base solide pour la construction du métaverse.
Mme Yang Jing a fait une déclaration très intéressante : au cours des six derniers mois, les humains ont été impliqués dans le processus, et l'IA a en fait été impliquée dans. la scène.
Par exemple, lors du concert du réveillon du Nouvel An 2023 de Jiangsu Satellite TV, lorsque Deng Ziqi a chanté "Gloria" de "Revelation", d'énormes vagues sont soudainement apparues autour de lui, générées par la technologie d'AIGC et la technologie AR.
Cette présentation visuelle est quelque chose que des centaines de millions de téléspectateurs en Chine peuvent voir de leurs propres yeux, le choc du métaverse.
Et derrière cette étape, il y a quelques technologies noires de NVIDIA comme support. He Zhan a fait le décryptage sur place.
Par exemple, cet effet spécial d'eau de mer est une direction d'application importante pour la génération de contenu. Cette scène utilise la technologie XR et la combine avec la dernière technologie générée par l'AIGC pour nous présenter un magnifique festin visuel. Derrière ces technologies, il y a aussi des avancées en matière de graphisme.
La deuxième technologie noire est l’optimisation par NVIDIA des algorithmes d’accélération du deep learning de l’IA. Sur scène, c'est l'effet de la mise en forme itérative du modèle de formation à grande échelle.
Par exemple, l'eau de mer nécessite beaucoup de simulations et davantage d'ensembles de données de formation de modèles. Après sa présentation finale sur scène, le public peut profiter du magnifique chant tout en étant immergé dans la scène.
Sur la base du contexte ci-dessus, Mme Yang Jing a demandé à He Zhan : Derrière une itération aussi rapide et forte, dans cette vague d'IA générative, le contenu généré par l'intelligence artificielle (AIGC) quel algorithme se cache derrière ? Quelles sont les exigences en matière d'algorithmes et de puissance de calcul pour que les jeunes puissent l'utiliser pour surfer et être cool ?
He Zhan a donné une merveilleuse réponse à cette question sous plusieurs angles.
Tout d’abord, les concepts d’AIGC et d’IA générative ne sont pas loin de nous. Il existe plusieurs nœuds historiques qui permettent de mieux appréhender le contexte de développement de l’AIGC.
Dès 1957, il y avait le premier quatuor à cordes composé par l'intelligence artificielle - "Iliac Suite", qui était la première musique d'intelligence artificielle.
Lorsque l'époque a été repoussée à 2007, l'Université de New York a publié un roman créé par l'intelligence artificielle. Bien qu'il contienne diverses erreurs logiques et diverses intrigues vagues, il s'agit du premier roman entièrement réalisé par l'IA.
Le prochain moment est 2014. Cette année-là, le GAN (Generative Adversarial Network) est apparu.
Ces trois moments se trouvent être des étapes itératives différentes de l'IA générative ou de l'AIGC.
Il y a une chose très intéressante là-dedans, je me demande si les lecteurs l'ont remarqué -
Dans la première étape du développement de l'IA, c'est-à-dire la naissance de la première musique générée par l'IA "Iliac Suite", Le premier roman généré par l'IA a pris 50 ans ; mais seulement 7 ans se sont écoulés entre le premier roman généré par l'IA et l'émergence du réseau GAN.
Ces dernières années, notamment au cours des six derniers mois, l’IA générative s’est multipliée. Il existe du texte à image DALL-E2, Midjourney, Stable Diffusion, etc. Ces modèles sont itérés en une semaine ou deux, ce qui est très rapide.
L'itération rapide de la technologie d'apprentissage profond, y compris la génération de GAN que nous venons de mentionner en 2014, a considérablement accéléré le développement de la technologie AIGC générative.
Comment les jeunes devraient-ils utiliser la technologie de l’AIGC ? Selon He Zhan, l'avenir est infiniment imaginatif. Nous pouvons tous constater qu’il existe de plus en plus d’emplois liés au contenu créatif.
Y compris l'IA évoquée tout à l'heure pour la rédaction d'articles, la création musicale, la post-production, etc. Ces diverses applications peuvent offrir aux jeunes beaucoup d'espace pour explorer et explorer.
Si les jeunes acceptent ces changements et continuent de développer leurs capacités, ils auront un potentiel illimité à l'avenir.
2022 est l'année où le métaverse explose, mais avant que le métaverse ne puisse rattraper son retard, le nouveau concept d'AIGC est devenu populaire sur Internet à une vitesse fulgurante.
Les partenaires de Sequoia Capital ont même co-écrit un article avec GPT-3, prédisant que l'AIGC formerait une nouvelle industrie de plusieurs milliards de dollars.
Mme Yang Jing a demandé : Pourquoi l'AIGC profitera-t-elle du vent d'est pour exploser en 2022 ? Quelle est la logique technique et la logique industrielle derrière cela ? Et quelles sont les similitudes et les différences entre le Metaverse et l’AIGC ?
He Zhan a expliqué que lorsqu'on parle de GPT-3, il faut mentionner les paramètres qui le sous-tendent : 175 milliards.
Lorsque GPT-3 a été publié pour la première fois, de nombreux chercheurs et développeurs ont été stupéfaits. Il y a à peine une semaine, un rapport a été publié sur l'échauffement de GPT-4, qui mentionnait que les paramètres de GPT-4 pouvaient atteindre 100 000 milliards.
Pour les modèles qui sont entrés dans le niveau des 100 milliards de paramètres, à quoi ressemblera le contenu qu'ils créeront à l'avenir ? C’est quelque chose que tout le monde peut espérer.
GPT-3 et GPT-4 jouent le rôle de production de contenu pour le Metaverse.
Si vous souhaitez que les applications Metaverse se développent rapidement de manière itérative, vous devez impliquer autant de personnes que possible.
Par exemple, si vous souhaitez que tout le monde participe à la plateforme Omniverse, vous devez abaisser le seuil technique afin que tout le monde puisse l'utiliser pour créer plus d'œuvres.
En ce moment, vous avez besoin d'outils qui peuvent être générés rapidement, rapides, bons et peu coûteux.
Alors d'où vient la productivité ? C'est un outil issu de l'AIGC génératif.
Maintenant, de nombreuses entreprises, dont NVIDIA, fabriquent des systèmes de conférence. Il existe un algorithme Maxine dans la vidéoconférence. Si vous souhaitez boire de l'eau en conduisant, l'algorithme peut corriger votre visage dans votre nouveau visage lorsque vous allez boire de l'eau, faisant croire aux autres que vous regardez l'écran.
Hmm ? Attends, ce n'est pas de la pêche ?
Oui, en fait, c'est de la pêche.
Il y a quelques semaines, NVIDIA a eu un échange d'utilisateurs intéressant.
Certains utilisateurs ont déclaré vouloir une salle de diffusion en direct comme celle-ci. Il devrait y avoir des cadres photo ou des illustrations dans le livre. Il devrait y avoir un ciel bleu, des nuages blancs, etc. .
En fait, ce genre d'exigence n'est pas aussi exigeant que la scène en studio, et c'est tout à fait réalisable désormais.
Par exemple, pour le papier peint du bureau, vous pouvez utiliser l'outil pour saisir le style et le ton de votre choix, et il produira des effets en temps réel.
De nos jours, ces avancées technologiques ont complètement stimulé la créativité personnelle.
Imaginez, dans le passé, vous deviez dessiner une peinture à l'huile, mais maintenant vous pouvez directement laisser l'IA la générer rapidement.
Mme Yang Jing a déclaré que cette idée est vraiment excitante, car il y a maintenant des dizaines de millions, voire des centaines de millions d'utilisateurs derrière les comptes vidéo sur Weibo et WeChat. Si l’IA peut être utilisée pour générer des effets spéciaux ou des vidéos, elle stimulera sans aucun doute le désir créatif de nombreuses personnes.
Alors, ce souhait peut-il se réaliser en 2023 ?
He Zhan a cité un rapport d'un organisme de recherche bien connu. Selon ce rapport, la proportion actuelle de l'IA générative dans l'ensemble de la génération de l'intelligence artificielle est inférieure à 1 %. Par conséquent, s’il peut atteindre 10 % en 2025, ce sera un résultat étonnant.
Dans le domaine des biosciences et des soins médicaux, d'ici 2050, la proportion de médicaments et de matériaux générés par l'IA pourrait atteindre 30 %.
Alors, parmi les différentes technologies d’IA générative, lesquelles peuvent être les plus meurtrières ? Quand l'AIGC s'adressera-t-elle vraiment aux masses et deviendra-t-elle une super APP, et quelles entreprises remporteront cette opportunité en or ?
He Zhan estime que la chose la plus critique est d'identifier quelles applications tueuses sont nécessaires pour ces applications.
Par exemple, vous avez besoin de concevoir une bouilloire électrique, mais vous voulez être paresseux et en profiter, que devez-vous faire ?
Il existe désormais de nombreux outils de génération de modèles 3D proposés par de grands fabricants qui permettent de personnaliser ce type de conception.
Par exemple, DreamFusion de Google et Magic 3D de NVIDIA peuvent générer l'effet souhaité en saisissant simplement un morceau de texte.
Pour résumer, l'AIGC peut exploser à tout moment tant qu'il peut répondre aux besoins des concepteurs ou des ingénieurs.
De toute évidence, l'IA générative est plus étroitement intégrée au contenu. Dans le commerce électronique, les médias, le cinéma et la télévision et d'autres industries, l'IA peut être utilisée pour aider à la création de scripts vidéo et de scènes de jeu. génération, les personnes numériques aident au transport des marchandises, à la présentation des produits XR, etc.
Désormais, vous pouvez générer un script ou même une courte vidéo ou un film avec seulement quelques mots. Et si l’AIGC est mis en œuvre à grande échelle à l’avenir, quel maillon de la chaîne industrielle aura le plus grand impact ?
He Zhan a répondu que le drame Shuang qui est très populaire récemment sur les comptes vidéo a été filmé en utilisant Shuangwen. Mais la productivité de ce processus fait réellement défaut.
Il faut savoir qu'il y a environ 100 000 employés de production derrière Shuangju en Chine. Ces 100 000 personnes se trouvent au bout de toute la chaîne de production, et leurs œuvres doivent passer par de nombreuses mains avant de pouvoir véritablement devenir populaires sur scène ou. l'écran fonctionne.
Ces employés de production ont travaillé très dur mais n'ont pas obtenu beaucoup de bénéfices. Cependant, si Shuangju peut être produit rapidement via AIGC, un groupe de personnes viendra. Lorsque le seuil technique est abaissé, la productivité augmente et il y a naturellement une boucle fermée.
De plus, non seulement les scénaristes, mais aussi dans des domaines tels que la recherche et le développement de médicaments, l'éducation, etc., bénéficieront d'une telle boucle fermée de production, de sortie et d'avantages économiques.
Cependant, Mme Yang Jing a soulevé une question très critique : étant donné que des articles sympas et des drames sympas peuvent être générés en un seul clic, les jeunes s'appuieront-ils trop sur de tels outils et perdront-ils leur imagination ?
He Zhan a dit qu'il est certain que les outils d'IA ne feront pas perdre leur imagination aux gens.
Par exemple, Nvidia a organisé une semaine de design à Hangzhou l'année dernière et a présenté un processus appelé "Magic Pen Ma Liang" - Nvidia Canvas. Tracez une courbe sur le côté gauche et sur le côté droit, vous pouvez utiliser votre entrée pour laisser l'IA créer une image.
Dessinez simplement quelques traits et une véritable œuvre semblable à une photo sera générée sur la droite.
Ce qui a beaucoup ému He Zhan, c'est que beaucoup d'enfants présents étaient beaucoup plus sérieux que les adultes et étaient très attentifs. Et beaucoup d’adultes plaisantent ou ont une attitude timide.
Par conséquent, les peintures qu'ils ont dessinées étaient plus imaginatives que celles exposées par les adultes.
Le même outil d'IA produit des œuvres complètement différentes. Cela nous indique que si l’imagination d’entrée est différente, l’effet obtenu par l’œuvre est complètement différent. Par conséquent, même les outils issus de la technologie restent indissociables de l’imagination et de la concentration humaines.
Ainsi, l'IA générative peut stimuler l'imagination des jeunes, libérer leur réflexion des contraintes et laisser leur imagination prendre des ailes. Aussi étonnants que soient les outils qui apparaîtront dans le futur, la contribution finale dépend toujours de nous-mêmes.
En parlant de cela, nous devons mentionner que Google, Microsoft, Meta et d'autres acteurs majeurs se disputent récemment la première place. De nouvelles licornes comme OpenAI ont également récemment attiré l'attention avec ChatGPT et ont reçu plus de 10 milliards de dollars d'investissement de Microsoft.
Dans le même temps, les grands fabricants nationaux tels que BAT se précipitent également dans le domaine de l'AIGC.
Quels joueurs seront les favoris ? Quel est le plus grand moment fort du développement technologique en 2023 ?
He Zhan pense que les grandes sociétés Internet nationales auront certainement des modèles similaires à ChatGPT.
Par exemple, les achats en ligne d'Alibaba, les réseaux sociaux de Tencent, etc., il existe de nombreuses applications Lenovo, et les grands fabricants investiront certainement massivement.
À la fin du programme, Mme Yang Jing a parlé d'un rêve magique qu'elle a fait récemment. Dans le rêve, ses camarades de classe lui offraient un album photo, qui présentait de manière vivante les scènes les plus mémorables de sa vie avec des chiffres et des images, comme un livre de vie vivant.
De là, Yang Jing a eu une merveilleuse idée : la technologie AIGC peut-elle être utilisée pour générer automatiquement un album photo virtuel à partir des images d'une personne pendant un an ou toute une vie ? Si nous voulons revoir notre Weibo ou nos Moments, il sera difficile de retrouver ces souvenirs jour après jour. Cependant, si nous utilisons l'IA pour revoir ces scènes et générer automatiquement un livre de vie, ce sera beaucoup plus facile.
He Zhan a dit que le problème n'est pas grave, tout comme les téléphones portables nous poussent parfois un instant, et la même logique s'applique.
Nous pouvons utiliser nos données des dernières années comme entrée, puis les saisir et les générer. Et vous pouvez demander à être plus tendre ou plus joyeux, et l'album photo généré aura également les expressions émotionnelles correspondantes.
Mme Yang Jing a parlé d'un chiot qu'elle a élevé une fois, nommé Xiaodoudou, décédé en 2020. Elle a vu une fois une publicité dans laquelle si vous insérez une photo d'un chien dans le produit, cela générerait un album photo de la vie du chien. Mais rechercher spécifiquement des photos de chiens peut être gênant, donc si l'IA peut les rechercher automatiquement à partir de la galerie, elle répondra certainement aux besoins de nombreuses personnes.
He Zhan a été très ému après avoir entendu cela. Il pensait également qu'à mesure que les outils se développeraient de plus en plus vite, ils entreraient de plus en plus dans la vie des gens ordinaires, et de nouvelles industries émergeraient certainement. utilisation Ces outils sont transformés en nouvelles applications.
Yang Jing a dit que nos partenaires, nos animaux de compagnie et nos proches sont toutes les faiblesses et les parties les plus tendres de nos vies. Ils sont les plus grands atouts de la nature humaine.
En plus d'articles sympas et de drames sympas, le futur métaverse aura également des villes virtuelles à grande échelle et de nombreuses stars virtuelles avec des personnalités différentes, qui ne sont même pas des êtres humains.
Ces clones numériques d'étoiles virtuelles et réelles peuvent générer de nouveaux albums photo numériques et films virtuels, créant ainsi d'innombrables livres de vie. À l'avenir, AIGC aura la capacité de générer une nouvelle planète numérique, une nouvelle terre numérique ou même une nouvelle. Un métaverse numérique global ?
He Zhan croit que tout est possible. Pensez-y, toutes ces technologies favorisent en fin de compte la productivité, et maintenant, les besoins de chacun existent déjà, comme générer un album photo pour permettre aux gens de revenir sur ces moments tendres. Ce dont les utilisateurs ont besoin est rapide, bon et bon marché. Par exemple, un album photo peut être généré pour plus de dix yuans.
À la fin du programme, Mme Yang Jing a conclu : Le mantra de Huang Renxun est « d'économiser de l'argent », donc une IA générative rapide, bonne et puissante sera certainement capable de renverser l'avenir de l'humanité.
Donc, en 2023, grâce à l'IA générative de nous avoir fait traverser la mer Rouge et de nous amener à revoir les souvenirs chaleureux de nos vies, nous attendons encore plus avec impatience l'explosion de l'IA générative en 2023, qui apportera un monde coloré, ainsi qu'un métaverse et un nouvel univers plein de possibilités infinies et d'une puissance de calcul au niveau de la planète.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!