Dans l'après-midi du 16 mars, Baidu a tenu une conférence de presse à son siège de Pékin, sur le thème de la nouvelle génération de grands modèles de langage et de produits d'IA générativeWenxinYiyan. Robin Li, fondateur, président et PDG de Baidu, et Wang Haifeng, directeur de la technologie de Baidu, ont assisté et démontré les cinq scénarios d'utilisation de Wen Xin Yi Yan dans la création littéraire, la création de rédaction commerciale, le calcul mathématique, la compréhension du chinois et la multi- génération modale.
À en juger par la démonstration en direct, Wen Xinyiyan a la capacité de comprendre les intentions humaines dans une certaine mesure, et l'exactitude, la logique et la fluidité de ses réponses se rapprochent progressivement des niveaux humains. Cependant, Robin Li a également mentionné à plusieurs reprises que ce type de grand modèle de langage est loin d'être au stade de développement et de perfection, et qu'il y a beaucoup de place à l'amélioration à l'avenir, il se développera certainement rapidement et changera à chaque passage. jour.
Baidu a également annoncé le plan de test sur invitation de Wen Xinyiyan. À partir du 16 mars, le premier groupe d'utilisateurs pourra découvrir le produit sur le site officiel de Wenxinyiyan en invitant des codes de test, et il sera ouvert à davantage d'utilisateurs à l'avenir. De plus, Baidu Smart Cloud ouvrira bientôt les services d'appel de l'interface API Wenxinyiyan aux entreprises clientes. Les réservations seront officiellement ouvertes le 16 mars. Recherchez « Baidu Smart Cloud » pour accéder au site officiel et vous pourrez postuler pour rejoindre le test du service Wenxin Yiyan Cloud.
Actuellement, les grands modèles de langage et l'IA générative représentent un nouveau paradigme technologique et sont des opportunités que toutes les entreprises du monde ne peuvent pas manquer. Baidu Wenxinyiyan se positionne comme une plateforme d'autonomisation de type base d'intelligence artificielle, qui contribuera à la transformation intelligente de milliers de secteurs tels que la finance, l'énergie, les médias et les affaires gouvernementales. Robin Li a déclaré : « Baidu espère travailler avec tout le monde pour promouvoir l'avancement de la technologie de l'intelligence artificielle, afin que chacun puisse utiliser les outils de productivité les plus avancés, afin que tout le monde puisse en bénéficier
Lors de la conférence de presse, Robin Li a montré. Les mots de Wen Xin Performance dans cinq scénarios d'utilisation, y compris la création littéraire, la création de rédaction commerciale, le calcul mathématique, la compréhension du chinois et la génération multimodale.
Sur la scène de la création littéraire, Wen Xinyiyan a résumé le contenu principal du célèbre roman de science-fiction « Le problème des trois corps » sur la base de questions de dialogue et a proposé cinq angles suggérés pour continuer à écrire « Le problème des trois corps » ", reflétant les questions et réponses du dialogue, Capacité globale à résumer, analyser et créer du contenu.
De plus, Wen Xinyiyan a répondu avec précision aux questions factuelles sur l'auteur de "Le problème à trois corps" et l'acteur de la série télévisée. L'IA générative « invente souvent des choses » lorsqu'elle répond à des questions factuelles, et Wen Xinyiyan poursuit le concept de grand modèle amélioré par les connaissances de Baidu et améliore considérablement l'exactitude des questions factuelles.
Dans le scénario de création de rédaction commerciale, Wen Xinyiyan a accompli avec succès les tâches créatives consistant à nommer l'entreprise, à rédiger un slogan et à rédiger un communiqué de presse.
Au cours de trois créations de contenu consécutives, Wen Xinyiyan a été capable de comprendre avec précision les intentions humaines et de les exprimer clairement. Il s'agit de « l'émergence de l'intelligence » qui se produit sur la base d'une énorme échelle de données. Les données d'entraînement du grand modèle de Wenxin Yiyan comprennent des milliards de données de pages Web, des milliards de données de recherche et de données d'images, des dizaines de milliards de données d'appels vocaux quotidiens et un graphique de connaissances de 550 milliards de faits.
Wen Xinyiyan possède également un certain degré de capacité de réflexion et peut apprendre des tâches relativement complexes telles que les déductions mathématiques et le raisonnement logique. Face à des questions classiques telles que « Poulet et lapin dans la même cage » qui entraînent la pensée logique humaine, Wen Xinyiyan peut comprendre le sens de la question et avoir les bonnes idées pour résoudre le problème, puis suivre les bonnes étapes pour calculer le problème. étape par étape comme un étudiant. Bonne réponse.
La création littéraire, la création de rédaction commerciale et le calcul mathématique sont des avantages et des capacités communs aux grands modèles linguistiques. Sur cette base, Wenxinyiyan montre également une meilleure compréhension du chinois et des capacités de génération multimodale.
Lors de la démonstration sur place, Wen Xinyiyan a correctement expliqué la signification de l'idiome « Le papier Luoyang est cher » et la théorie économique correspondante de « Le papier Luoyang est cher », et a également créé un poème acrostiche en utilisant les quatre mots « Papier Luoyang ça coûte cher".
En termes de génération multimodale, Robin Li a démontré la capacité de Wen Xin Yi Yan à générer du texte, des images, de l'audio et de la vidéo. Il est intéressant de noter que Wenxinyiyan peut même générer de la parole dans des dialectes tels que le dialecte du Sichuan ; la capacité de génération vidéo de Wenxinyiyan n'est pas actuellement ouverte à tous les utilisateurs en raison de son coût élevé et sera progressivement accessible à l'avenir.
« La multimodalité est une tendance claire de développement de l'IA générative. » Robin Li a déclaré : « À l'avenir, à mesure que la capacité de Baidu à unifier de grands modèles multimodaux augmente, les capacités de génération multimodale de Wen Xinyiyan continueront de s'améliorer »
À en juger par celle de Wen Xinyiyan. performance, il a la capacité de comprendre les intentions humaines dans une certaine mesure, et l'exactitude, la logique et la fluidité de ses réponses se rapprochent progressivement des niveaux humains. Mais globalement, ce type de grand modèle de langage est loin d’être totalement développé et repose sur une itération progressive grâce à de réels retours d’utilisateurs.
Wang Haifeng a déclaré que Wenxinyiyan est une nouvelle génération de grands modèles de langage améliorés par les connaissances, développés sur la base des modèles des séries ERNIE et PLATO. Ses technologies clés comprennent le réglage fin supervisé, l'apprentissage par renforcement avec rétroaction humaine, les invites, l'amélioration des connaissances, l'amélioration de la récupération et l'amélioration du dialogue. Les trois premiers sont des technologies utilisées par des modèles de langage aussi vastes, et ont été appliqués et accumulés dans ERNIE et PLATO, et ont été encore renforcés et peaufinés dans Wen Xinyiyan ; les trois derniers sont des technologies pour lesquelles Baidu possède déjà des avantages techniques en matière de réinnovation ; C'est aussi la base pour que Wen Xinyiyan devienne de plus en plus fort à l'avenir.
Robin Li a souligné : « Wen Xinyiyan établira un volant d'inertie entre les commentaires réels des utilisateurs, les appels des développeurs et les itérations du modèle. L'effet s'améliorera rapidement, vous donnant une « séparation pendant trois jours, et vous serez impressionné » « Surprise ».
Robin Li a déclaré que Baidu est actuellement la première entreprise parmi les grandes entreprises mondiales à créer un produit ChatGPT de référence. Robin Li a souligné : « Quelle que soit l'entreprise dont il s'agit, il est impossible de créer un modèle de langage d'une telle envergure en quelques mois. L'apprentissage en profondeur et le traitement du langage naturel nécessitent des années de persévérance et d'accumulation, et cela ne peut pas être fait rapidement.Oui, Wen Xinyiyan s’inscrit dans la continuité des efforts de Baidu au cours des dernières années. Alors que les humains entrent dans l'ère de l'intelligence artificielle, la pile technologique de la technologie informatique a subi des changements fondamentaux, passant des trois dernières couches aux quatre couches de « puce-cadre-modèle-application ». Aujourd'hui, Baidu est l'une des rares sociétés d'intelligence artificielle au monde à disposer d'une disposition complète dans ces quatre couches, du cœur de puce Kunlun haut de gamme au cadre d'apprentissage profond Feipiao, en passant par les grands modèles pré-entraînés Wenxin, pour rechercher , cloud intelligent, des applications telles que la conduite autonome et Xiaodu disposent de technologies auto-développées de pointe à tous les niveaux.
Robin Li estime que l'avantage de la configuration full-stack de Baidu AI est qu'elle peut réaliser une optimisation de bout en bout dans l'architecture à quatre couches de la pile technologique, améliorant considérablement l'efficacité. En particulier, il existe une forte synergie entre la couche cadre et la couche modèle, ce qui peut aider à créer des modèles plus efficaces et à réduire considérablement les coûts. En fait, la formation et l’inférence de modèles à très grande échelle posent un défi majeur au cadre d’apprentissage profond. Par exemple, afin de prendre en charge une formation distribuée efficace de centaines de milliards de modèles de paramètres, Baidu Flying Paddle a spécialement développé une technologie parallèle hybride 4D.
Depuis que Baidu a officiellement annoncé « Wen Xin Yi Yan » en février, plus de 650 entreprises ont annoncé leur accès à l'écosystème Wen Xin Yi Yan.
Robin Li prédit que les grands modèles linguistiques apporteront trois opportunités industrielles majeures.
La première catégorie est un nouveau type d'entreprise de cloud computing, dont le modèle économique principal est passé de l'IaaS au MaaS. Les paroles de Wen Xin changeront fondamentalement les règles du jeu dans l'industrie du cloud computing. Dans le passé, les entreprises choisissaient des fournisseurs de cloud computing davantage en fonction des services cloud de base tels que la puissance de calcul et le stockage. À l'avenir, tout dépendra davantage de la qualité du cadre, de la qualité du modèle et de la collaboration entre les quatre couches du modèle, du cadre, de la puce et de l'application.
Wen Xinyiyan fournira des services au monde extérieur via Baidu Intelligent Cloud pour aider les entreprises à créer leurs propres modèles et applications. Des domaines clés tels que l'agriculture, l'industrie, la finance, l'éducation, les soins médicaux, les transports et l'énergie amélioreront considérablement l'efficacité et. sera utilisé dans chaque industrie. Une industrie forme rapidement un nouvel espace industriel pour aider à réaliser la Chine numérique. Robin Li a annoncé que Baidu Smart Cloud tiendrait prochainement une conférence de presse, dont le thème serait centré sur les services cloud et les produits d'application de Wen Xinyiyan, qui incluent à la fois des services cloud publics et un déploiement privatisé.
La deuxième catégorie est celle des entreprises qui affinent les modèles industriels. Il s'agit de la couche intermédiaire entre le grand modèle général et les entreprises. Sur la base de leur connaissance du secteur, elles peuvent utiliser les capacités générales du grand modèle pour fournir des solutions aux clients de l'industrie. À cet égard, Baidu Wenxin Model a publié plus de 10 modèles industriels dans les domaines de l'énergie électrique, de la finance, des médias et d'autres domaines.
La troisième catégorie concerne les entreprises qui développent des applications basées sur de grandes bases de modèles, c'est-à-dire les fournisseurs de services applicatifs. Robin Li a affirmé que pour la plupart des entrepreneurs et des entreprises, la véritable opportunité n'est pas de créer à partir de zéro des modèles de base à grande échelle comme ChatGPT et Wenxinyiyan. Cela pourrait constituer une réelle opportunité de développer de manière préventive d’importants services d’application basés sur un grand modèle de langage général. À l'heure actuelle, sur la base de la génération de texte, de la génération d'images, de la génération audio, de la génération vidéo, des personnes numériques, de la 3D et d'autres scénarios, de nombreuses entreprises vedettes entrepreneuriales ont émergé, qui pourraient devenir de nouveaux géants à l'avenir.
« Nous pensons que l'intelligence artificielle va complètement changer tous les secteurs que nous avons aujourd'hui. La valeur à long terme de l'IA et ses changements perturbateurs dans tous les domaines de la vie ne font que commencer. À l'avenir, il y aura de plus en plus d'applications tueuses et phénoménales. des produits apparaissent, d'autres étapes se produiront", a déclaré Robin Li. (une orange)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!