Pékin accueillera la conférence des développeurs d'apprentissage profond WAVE SUMMIT 2023 organisée par le Centre national de recherche en ingénierie pour les technologies et applications d'apprentissage profond
Wang Haifeng, directeur de la technologie de Baidu et directeur du Centre national de recherche en ingénierie pour les technologies et applications d'apprentissage profond, a déclaré pour la première fois dans son discours d'ouverture que les modèles de langage à grande échelle possèdent les capacités de base de base de l'intelligence artificielle, notamment la compréhension , génération, logique et mémoire, et sont une intelligence artificielle universelle L'intelligence apporte un nouvel espoir
8 millions de développeurs utilisent Flying Paddle et plus de 800 000 modèles ont été créés
En avril 2019, la conférence des développeurs Deep Learning WAVE SUMMIT s'est tenue pour la première fois. Lors de la conférence, Wang Haifeng a souligné la polyvalence de l'apprentissage profond et ses caractéristiques de standardisation, d'automatisation et de modularité pour la production industrielle de masse, ce qui a promu l'intelligence artificielle au stade de la production industrielle de masse. Après quatre années de développement, les progrès de la technologie et des applications du deep learning ont pleinement vérifié ce point de vue. La technologie du deep learning devient de plus en plus polyvalente, et la standardisation, l'automatisation et les fonctionnalités modulaires des plateformes de deep learning deviennent de plus en plus évidentes. Dans le même temps, l’essor des grands modèles pré-entraînés a encore élargi la profondeur et l’étendue des applications de l’intelligence artificielle. On peut donc dire que l’intelligence artificielle est entrée dans la phase de production industrielle de masse
En termes de standardisation, nous optimisons conjointement les frameworks et les modèles et nous adaptons uniformément à une variété de matériels pour rendre le modèle d'application plus concis et efficace, abaissant ainsi considérablement le seuil des applications d'intelligence artificielle. En termes d'automatisation, nous fournissons des solutions complètes de R&D en intelligence artificielle, comprenant la formation, l'adaptation et le déploiement d'inférences pour améliorer l'efficacité. En termes de modularité, nous fournissons une riche bibliothèque de modèles de niveau industriel pour prendre en charge l'application pratique de l'intelligence artificielle dans divers scénarios
La plate-forme open source open source d'apprentissage profond de qualité industrielle de FeiPaddle et le grand modèle de Wenxin se promeuvent mutuellement, faisant prospérer l'écologie FeiPaddle, attirant 8 millions de développeurs, fournissant des services à 220 000 entreprises et institutions et créant 800 000 produits basés sur le modèle FeiPaddle. Wang Haifeng a expliqué la signification profonde du nom chinois de la communauté de développeurs Flying Paddle AI Studio « Galaxy Community » : « Wenxin et Flying Paddle se mélangent et naviguent ensemble vers la galaxie. Avec la promotion conjointe de Feipiao et Wenxin, nous travaillerons avec tous les développeurs pour construire la communauté Galaxy et explorer les possibilités infinies de l'intelligence artificielle générale
Les modèles linguistiques à grande échelle apportent un nouvel espoir à l'intelligence artificielle générale
Wang Haifeng estime que l'intelligence artificielle possède une variété de capacités typiques, parmi lesquelles les capacités de base de base incluent la compréhension, la génération, la logique et la mémoire. Plus ces quatre capacités sont fortes, plus l’intelligence artificielle se rapproche du niveau de l’intelligence artificielle générale. Le grand modèle de langage possède ces quatre capacités, apportant de l'espoir au développement de l'intelligence artificielle générale
Plus précisément, les capacités typiques de l'intelligence artificielle, telles que la création, la programmation, la résolution de problèmes, la planification, etc., sont basées sur des capacités de base de base, telles que la compréhension, la génération, la logique, la mémoire, etc., bien que le degré de dépendance varie à des degrés divers. Prenons l'exemple de la résolution de problèmes. De la compréhension de la question à la résolution de la question jusqu'à la rédaction de la réponse, vous devez utiliser de manière globale la compréhension, la mémoire, la logique et les capacités génératives
Comment obtenir ces capacités ? En prenant Wen Xinyiyan comme exemple, nous formons d'abord un grand modèle pré-entraîné en apprenant par fusion des milliards de données et des centaines de milliards de connaissances. Nous utilisons ensuite des techniques telles que le réglage fin supervisé, l'apprentissage par renforcement avec retour humain et les invites pour améliorer encore les performances du modèle. De plus, nous disposons également d'avantages techniques tels que l'amélioration des connaissances, l'amélioration de la récupération et l'amélioration du dialogue
Optimisez les sources de données et la distribution des données grâce à une variété de stratégies, créez des modèles de base pour la modélisation de textes longs, effectuez un réglage fin supervisé multi-types et multi-étapes et un réglage fin supervisé adaptatif multitâche, et mettez en œuvre des innovations technologiques telles que en tant que modèles de récompense à plusieurs niveaux et multi-granularités. Améliorer de manière globale les capacités générales de base. En termes de récupération et de connaissances améliorées, la capacité à maîtriser et à appliquer les connaissances du monde est améliorée grâce à l'amélioration des points de connaissances ; les capacités logiques sont améliorées grâce à la construction de données logiques à grande échelle, à la modélisation des connaissances logiques, à la combinaison de connaissances sémantiques multigranulaires et aux réseaux de neurones symboliques. grâce à la construction d'un système complet de sécurité des données, du contenu, des modèles et du système pour assurer la sécurité des grands modèles
Grâce à la technologie de formation parallèle hybride adaptative de bout en bout de Flying Paddle et à l'optimisation collaborative de la compression, de l'inférence et du déploiement de services, la vitesse de formation du grand modèle Wenxin a été augmentée de 3 fois et la vitesse d'inférence a été augmentée de plus. plus de 30 fois, améliorant ainsi l'efficacité
Grâce à une construction rapide, basée sur les données et à des applications améliorées par les plug-ins, nous avons lancé cinq plug-ins, dont Wen Xin Yi Yan, Baidu Search, Browsing Documents, E Yan Yi Tu, Shuo Tu Jie Hua et Yijing Liuying. Ces plug-ins permettent à nos modèles de générer des informations précises en temps réel, des résumés de texte longs et des questions-réponses, des informations sur les données et la production de graphiques, une création basée sur des images et des questions-réponses, ainsi que des vidéos Vincent. Grâce au mécanisme de plug-in, nous élargissons les limites des capacités des grands modèles pour mieux nous adapter aux besoins de divers scénarios. Wang Haifeng a déclaré qu'à l'avenir, nous travaillerons avec les développeurs pour créer un écosystème de plug-ins et partager les résultats de l'innovation technologique
L'intelligence artificielle représentée par de grands modèles de langage pénètre dans des milliers d'industries, accélérant la modernisation industrielle et la croissance économique. Dans ce processus, l'innovation technologique et la mise en œuvre d'applications forment un cercle vertueux. Les capacités telles que la compréhension, la génération, la logique et la mémoire continuent de s'améliorer. L'étendue et la profondeur des applications industrielles continuent de s'étendre. intelligence artificielle.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!