Que la machine soit anthropomorphisée, du « retard mental artificiel » à

Le 27 mai, Entrepreneurship Dark Horse a organisé le "2023 Leap•Dark Horse AIGC Summit" à Pékin. Le thème de cette conférence est « Prévoir un nouveau monde et construire un nouveau modèle ». Justin Cassel, ancien doyen associé de la School of Computer Science de l'Université Carnegie Mellon et connu comme un « expert en IA » et ancien président du Global Future Council on Computing au Forum économique mondial (WEF) de Davos, ainsi que du 360 Group , Zhiyuan Research Institute, des cadres supérieurs de nombreuses entreprises du secteur, dont Kunlun Wanwei, Yunzhisheng, BlueFocus, Wondershare Technology et Zhizhichuangyu, étaient présents et ont eu des échanges approfondis avec des milliers de participants.

Lors du sommet, Huang Wei, fondateur et PDG de Yunzhisheng, a partagé le thème « La route vers un avenir intelligent ».

Voici le contenu partagé :

Au début, nous voulions faire comme le font les experts, en espérant transmettre certaines méthodologies à la machine. Il y a dix ans, la machine a commencé à apprendre du retour d'erreurs. Ce sont les étapes et les voies générales de la technologie de l’intelligence artificielle dans le passé.

Aujourd'hui, OpenAI a lancé ChatGPT et des modèles de pré-formation, et toute l'intelligence est devenue plus anthropomorphique. Premièrement, nous avons utilisé une puissance de calcul très puissante pour lire tous les textes connus dans le monde et nous sommes entraînés pour former un grand modèle. Cela ressemble particulièrement au cerveau d'un bébé, qui peut avoir des dizaines ou des centaines de milliards de paramètres. Contrairement au cerveau humain, le bébé n'hérite que de l'apparence et de la personnalité de ses parents, mais le cerveau du grand modèle hérite des connaissances, qui sont. seulement l'état initial. , puis à travers diverses méthodes telles que le réglage fin, comme les enfants recevant diverses éducations au cours de leur croissance, l'évolution de l'ensemble du grand modèle sera plus anthropomorphique.

C'est un changement dans toute l'intelligence artificielle.

Quels sont les changements essentiels entre l’AGI d’aujourd’hui et d’avant ? Avant décembre 2022, l'ensemble de l'intelligence artificielle sera toujours une intelligence artificielle discriminante, exécutant des questions de jugement, des systèmes spéciaux et des modules intelligents pour effectuer certaines tâches spécifiques. D'une part, les performances de l'intelligence artificielle ne sont pas si intelligentes, et elles sont souvent critiquées par d'autres : « Ce que vous fournissez, c'est de l'intelligence artificielle », de sorte que dans le passé, le plafond des capacités de l'intelligence artificielle était bas.

Deuxièmement, dans de nombreux scénarios, les besoins des clients varient considérablement, mais les capacités de l'intelligence artificielle ne sont pas si puissantes. De nombreuses entreprises et équipes utilisent diverses personnalisations pour y répondre. Les entreprises d’intelligence artificielle ne sont pas comme les entreprises de haute technologie. Au cours des dix dernières années, elles ne pouvaient faire de l’IA discriminante qu’à l’ère des ateliers manuels. Mais il existe désormais de grands modèles et des capacités générales plus puissantes, et l'intelligence artificielle a commencé à entrer dans l'ère industrielle.

Avec des capacités de nouvelle génération et d'émergence, un modèle peut résoudre différents problèmes dans de nombreux scénarios. À l’époque actuelle, le grand modèle de l’intelligence artificielle est un générateur. Avant l’invention du moteur, les pays du Moyen-Orient n’étaient pas si riches et la valeur du pétrole n’était pas si grande. Tout comme aujourd’hui, les données peuvent être transformées en carburant et en capacités, et ces capacités peuvent être utilisées pour responsabiliser des milliers d’industries.

Pourquoi Yunzhisheng a-t-il pu lancer un grand modèle auto-développé en peu de temps ?

Après avoir vu AlphaGo en 2016, nous avons mis en œuvre des produits médicaux dans les hôpitaux pour aider les médecins du Peking Union Medical College Hospital et améliorer considérablement leur efficacité au travail. Dans le scénario hospitalier, les outils d'efficacité seuls ne suffisent pas. La véritable intelligence de l'intelligence artificielle est l'intelligence cognitive, proposée en 2017. L'intelligence cognitive nécessite une puissance de calcul relativement puissante.

Grâce à ces fondations, j'ai accumulé beaucoup d'expérience tant sur le plan académique qu'ingénieur. Pour un particulier, cette expérience est votre capacité à gagner votre vie, mais pour une entreprise, c'est le cœur de la compétitivité pour gagner sur le marché. Après avoir examiné le framework ChatGPT, nous avons constaté que rien de tout cela n'était nouveau. Il s'agissait toutes de combinaisons d'ingénierie existantes. Nous avons rapidement combiné cette capacité et l'avons investie dans le développement de grands modèles.

Que la machine soit anthropomorphisée, du « retard mental artificiel » à « lintelligence artificielle »

Nous avons sorti il y a trois jours un grand modèle commercial appelé Shanhai. Après avoir effectué une pré-formation, un ajustement précis des instructions et un apprentissage par renforcement basé sur les commentaires humains, nous avons constaté les capacités émergentes tant attendues. À cette époque, l’équipe réfléchissait à lui donner un nom. Je voyageais fréquemment à cette époque et je trouvais le nom plutôt bien. La mer est majestueuse et sa tolérance est grande, reflétant la capacité générative infinie des grands modèles. Les montagnes sont de hautes montagnes, et nous savons ce qui peut et ne peut pas être dit. C'est précisément pour souligner à la fois la capacité générative des grands modèles et des grands. -Modèles à l’échelle. Modéliser les problèmes de conformité en matière de sécurité.

Il y a un phénomène très intéressant. Tout le monde parle des grands modèles. L'accent national mis sur les grands modèles a commencé après la Fête du Printemps, mais personne n'en parle et ils n'en sont pas sûrs. Jusqu'à aujourd'hui, certains pensent que cela ne peut pas se faire uniquement avec la technologie. Même si les gens sont en place, le coût de la formation est très élevé et extrêmement coûteux. Les grands modèles ne constituent pas une révolution scientifique ou l'invention de nouveaux algorithmes, mais une combinaison d'algorithmes existants pour les agrandir. La plupart d'entre eux ont un coût et, bien sûr, de nombreux projets sont impliqués. Le point est juste.

D'un autre côté, si vous pensez que les modèles à grande échelle seront une grande opportunité dans les 10 à 20 prochaines années, mais que BAT ne peut pas y investir et abandonner, je pense qu'il y a encore une chance.

Au cours des dernières années, Yunzhisheng n'avait pas besoin de scientifiques particulièrement bons. Je pense même que cette question n'est pas quelque chose que les scientifiques font. le résultat doit être mauvais Les fabricants proposant des scénarios sont les plus susceptibles de réussir.

Le nom Shanhai a aussi une autre signification. Celui que vous aimez est séparé par les montagnes et les mers, et les montagnes et les mers peuvent être nivelées.

Le pouvoir des montagnes et des mers, c'est le décathlon. La capacité de génération est très subjective. Lorsqu'il s'agit de mettre en œuvre la scène, la capacité de compréhension du langage est très importante. Pourquoi ai-je pensé qu'elle était artificiellement retardée dans le passé ? L'amélioration des capacités de codage peut contribuer à améliorer les capacités de raisonnement des grands modèles, et les résultats doivent être conformes aux lois, réglementations et même aux valeurs morales nationales. Nous utilisons également l'architecture de plug-in GPT-4 pour aider les entreprises et les clients avec des services uniques allant de la sélection de données à la formation de modèles et au déploiement de modèles.

Pourquoi les grands modèles ont-ils des capacités de raisonnement logique complexes ? Nous l’avons fait aujourd’hui, mais je ne sais pas pourquoi. Il est difficile de dire si 50 milliards de paramètres ou 100 milliards de paramètres sont meilleurs. Peut-être que les neurones des 100 milliards de paramètres n’ont pas encore été activés.

En plus, il y a les soins médicaux. Au début, nous faisions des modèles à grande échelle. Beaucoup de gens pensaient que Yunzhisheng faisait des modèles industriels verticaux. Non, nous faisions des applications industrielles. Nous avons défié l'un des scénarios les plus sérieux : les soins médicaux. Au cours de la phase de pré-formation, nous avons collecté de nombreuses publications médicales, monographies, livres et dossiers médicaux, et accumulé des dizaines de millions de données réelles, qui peuvent être converties. dans nos données de mise au point.

De plus, nous avons également remporté le premier prix du Beijing Science and Technology Progress Award en 2019. Le projet primé est la technologie clé et l'application de la construction de graphes de connaissances à grande échelle. Nous possédons l'un des plus grands projets médicaux. graphiques de connaissances en Chine. Nous décomposons le graphique de connaissances en Les plug-ins de connaissances sont intégrés dans de grands modèles de langage, transformant les grands modèles en experts dans le domaine médical.

MedQA est un ensemble de tests de questions et réponses de connaissances médicales faisant très autorité, comprenant Med-PaLM, ChatGPT et GPT-4 de Google. Ils ont tous annoncé leurs résultats d'évaluation sur cet ensemble de tests. Shanhai a obtenu 81 lors de l'évaluation il n'y a pas longtemps. . points, ce qui dépasse largement les 71 points du GPT-4. Après l'amélioration du domaine, les grands modèles peuvent être transformés en experts dans un certain domaine. Il existe un autre chiffre qui peut être utilisé pour une comparaison horizontale. Le score d'IA le plus élevé connu pour que les diplômés des facultés de médecine réussissent l'examen de praticien clinique est de 456 points. Il s'agit de la super capacité obtenue par les grands modèles grâce à l'amélioration du domaine. .

Il est assez difficile de construire un grand modèle. Le seuil est très élevé. En plus de beaucoup d'argent, d'excellents ingénieurs algorithmiques et algorithmes, cela nécessite aussi beaucoup de capacités. et les mers. Intuitivement parlant, les grands modèles eux-mêmes sont de grands ensembles de données, et les grands modèles sont le travail des ingénieurs. Pourquoi Yunzhisheng peut-il produire des données d'évaluation très fiables et objectives en quelques mois ? Notre évaluation interne n'est pas seulement médicale et objective. domaines généraux, Yunzhisheng est l'un des meilleurs.

La plate-forme de puissance de calcul ne consiste pas seulement à acheter le nombre de cartes à brancher. Yunzhisheng dispose de près de 200P de puissance de calcul. L'efficacité de l'utilisation des clusters a atteint le plus haut niveau de l'industrie. Elle peut utiliser relativement peu de cartes pour s'entraîner. nous très rapidement.

Notre utilisation actuelle du cluster GPU peut atteindre 50 %. Les grands modèles nécessitent plusieurs cartes. Le niveau actuel de l'industrie est d'environ 42 %. Les grands modèles doivent également réaliser une formation parallèle hybride 3D. Qu’est-ce que la 3D ? Cela signifie la parallélisation du modèle, la parallélisation des données et la parallélisation du pipeline. Les tâches doivent être séparées respectivement en différentes cartes de nombreuses machines différentes pour le calcul, et enfin les résultats de réponse peuvent être obtenus rapidement. De plus, de nombreuses optimisations ont été apportées au raisonnement du modèle, et la vitesse de raisonnement a été multipliée par 5. Comment séparer la carte de formation et la carte d'inférence La carte de formation est A800, et la carte d'inférence peut réaliser un raisonnement rapide ? une seule carte A6000.

De plus, les données sont très importantes, l'échelle des données, la diversité des données et la haute qualité des données. Nous pouvons désormais prendre en charge le niveau de déduplication rapide 10T. Le nombre de formation de ChatGPT était auparavant de 45T, mais après optimisation, il en utilisait des centaines. de données G pour la formation.

Grâce à ces capacités, nous pouvons utiliser les capacités d'Atlas et d'UniDataOps pour mieux servir les clients de l'industrie de Shanhai.

L'Internet intelligent des objets est également une activité importante de l'entreprise. Nous avons de nombreuses implémentations. Les résultats utilisés dans le passé n'étaient vraiment pas très bons. Nous espérons qu'après la création de Shanhai, nous pourrons utiliser de grands modèles pour tout réaliser. produits Internet des objets existants.

Les soins médicaux sont la direction dans laquelle nous sommes optimistes. Dans le passé, dans le domaine médical, le produit avait principalement deux aspects. Premièrement, au lieu de taper sur le clavier avec les mains, on pouvait parler directement avec le microphone, ce qui améliorait grandement l'efficacité du travail du médecin et raccourcissait le temps. de saisir les dossiers médicaux de 3 heures à 1 heure. Deuxièmement, après avoir obtenu les dossiers médicaux, il existe également un système pour examiner les dossiers médicaux via le cerveau de l'IA pour vérifier s'il y a des erreurs dans les dossiers médicaux. nous avons la capacité d'IA grand modèle, que pouvons-nous faire ?

La vision de Shanhai est de créer un monde interconnecté et intuitif grâce à l'intelligence artificielle. Dans le passé, la définition de l'intelligence artificielle était de faire obéir les machines aux gens. Aujourd'hui, nous espérons que les machines ressembleront davantage à des humains. La communication entre les personnes et les choses deviendra plus intuitive et de nouvelles capacités apporteront de nouveaux produits et de nouveaux modèles commerciaux. Je suis tout à fait disposé à accueillir la nouvelle ère des grands modèles avec tout le monde ici.

Scannez le code pour rejoindre le groupe d'échange d'entrepreneurs dark horse

↓↓↓

Scannez le QR code ci-dessous

Rejoignez le camp industriel Dark Horse AIGC

Comprendre la logique sous-jacente de l'AIGC et se connecter à l'avenir de l'industrie en une seule étape

↓↓↓

Partagez, aimez et regardez pour compléter le combo à trois succès et proposer un bon contenu à davantage de personnes qui en ont besoin.

Du contenu plus excitant, tout en compte vidéo i dark horse

↓↓↓

Suivez la matrice de communication Dark Horse et obtenez du contenu plus passionnant

↓↓ ↓

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Que la machine soit anthropomorphisée, du « retard mental artificiel » à « l'intelligence artificielle »