En décembre 2022, ChatGPT est né. OpenAI a changé le paradigme de la recherche scientifique et des applications d'ingénierie avec un résultat comparable à celui d'une bombe nucléaire. En Chine, ChatGPT a reçu une large attention et de profondes discussions. Au cours du mois dernier, j'ai visité de grandes universités, des instituts de recherche, de grandes usines, des start-ups et des sociétés de capital-risque, de Pékin à Shanghai, en passant par Hangzhou et Shenzhen, et j'ai discuté avec tous les principaux acteurs. Le jeu d'échelle a déjà commencé en Chine. Comment les acteurs au centre de la tempête peuvent-ils y parvenir étant donné l'énorme écart entre la technologie et l'écologie nationales et l'avant-garde mondiale ? Qui peut faire ça ?
Qin a perdu son cerf et le monde entier l'a chassé. ———— "Documents historiques·Biographies du marquis de Huaiyin"
Chaque fois que j'entre en contact avec une startup, je demanderai au même question : « Où est ChatGPT ? Que veux-tu faire ? » J'ai probablement reçu trois réponses différentes. La première réponse est claire : construire le ChatGPT chinois.
1.1 Créer le ChatGPT chinois
Parce qu'il est là, je veux le reproduire et le localiser. Il s'agit d'une pensée Internet chinoise très classique axée sur les produits. Cette idée est également un modèle commercial courant de l’Internet chinois au cours des deux dernières décennies : d’abord, la Silicon Valley fabrique quelque chose, puis nous le copions.
Mais le problème ici est que, tout d'abord, ChatGPT n'est pas comme un logiciel d'appel de taxi, et la difficulté de reproduction est complètement différente. D'un point de vue humain, la création de GPT est le résultat de recherches continues menées par les meilleurs scientifiques et ingénieurs du monde depuis 2015. Le scientifique en chef d'OpenAI, Ilya Sutskever[1], croit profondément que l'AGI peut être atteint. En tant que disciple de Geoffery Hinton, lauréat du prix Turing, il étudie l'apprentissage profond depuis 2007. Il compte 370 000 citations et les articles qu’il a publiés touchent avec précision tous les nœuds clés du Deep Learning au cours des dix dernières années. Même avec une équipe aussi solide, il a fallu quatre ans pour passer du GPT 2 au GPT 3.5. On peut imaginer la difficulté de sa science et de son ingénierie.
En même temps, la première génération de ChatGPT est une démo créée par OpenAI basée sur le modèle de base de GPT 3.5. Après passé deux semaines à peaufiner le dialogue , elle a été rejetée . La véritable force ici n’est pas le produit ChatGPT, mais le modèle de base sous-jacent GPT 3.5. Ce modèle est toujours en évolution. La série GPT 3.5 a été mise à jour avec trois versions majeures en 2022[2], chaque version majeure est nettement plus puissante que la version précédente, de même, ChatGPT a été mis à jour avec un total de quatre mises à jour en deux ; mois après sa sortie. Chaque petite version présente des améliorations évidentes par rapport à la version précédente dans une seule dimension. Tous les modèles OpenAI évoluent constamment et se renforcent au fil du temps.
Cela signifie que si vous vous concentrez uniquement sur le produit actuel ChatGPT,revient à essayer de trouver une épée. Lorsque ChatGPT est apparu, cela a porté un coup dur à la réduction de dimensionnalité des assistants vocaux existants si vous ne pouvez pas voir l'évolution du modèle de base, même si vous passez un an ou deux à travailler dur pour créer quelque chose de similaire, le fondement d'OpenAI à cette époque ; Les modèles continuent également à devenir plus forts. S'ils continuent à produire et à peaufiner un produit plus solide avec un nouveau modèle de base plus solide, seront-ils à nouveau touchés par une réduction de dimensionnalité ?
L'approche consistant à sculpter un bateau et à chercher une épée ne fonctionnera pas.
1.2 Devenir l'OpenAI de la Chine
La deuxième réponse est d'être l'OpenAI de la Chine. Le joueur qui a donné cette réponse est sorti de la pensée classique du produit Internet chinois. Ils ont non seulement vu un produit unique, mais ont également vu la puissante force motrice de l'évolution continue du modèle de base derrière ce produit, qui vient de la densité des talents de pointe et de la structure organisationnelle avancée.Donc, si vous voulez faire cela, vous devez non seulement voir le produit, mais aussi l'équipe de talents et la structure organisationnelle derrière lui, classées par rareté, ; Personnes>> Carte >> Argent . Mais le problème ici est que différents sols encouragent l'innovation à des degrés différents. Lors de la création d’OpenAI en 2015, ses investisseurs croyaient en AGI, même si aucun profit n’avait été constaté à l’époque. Maintenant que le GPT a été développé, les investisseurs nationaux ont également cru en l'AGI, mais leurs convictions peuvent être différentes : Croyez-vous que l'AGI peut rapporter de l'argent, ou pensez-vous que l'AGI peut promouvoir le développement humain ? De plus, même si OpenAI est né ici et apparaîtra demain, l'accord conclu avec Microsoft peut-il être conclu avec les fabricants nationaux de cloud computing ? La formation et l'inférence de grands modèles nécessitent des coûts énormes et nécessitent un moteur de cloud computing comme support. Microsoft peut consacrer tous ses efforts pour permettre à l'ensemble d'Azure d'aider OpenAI[4] Si cela change en Chine, est-il possible pour Alibaba Cloud d'aider une startup ?
1.3 Explorez les limites de l'intelligence explorer les limites de l'intelligence. C'est la meilleure réponse que j'ai entendue. Cela va bien au-delà de la conception classique des produits Internet consistant à rechercher une épée à chaque instant. Il voit également l'importance de la structure organisationnelle et de la densité des talents de pointe, et réfléchit. sur la façon d'intégrer les choses les plus profondes et les plus profondes. Les problèmes difficiles sont résolus avec les approches les plus innovantes. 2. Réflexion extrême Les quatre points ci-dessus ne peuvent être vus qu'à ce stade. Ils peuvent être renforcés immédiatement, mais aucun point n'a encore été renforcé. Au fil du temps et de l'évolution du modèle, d'autres dimensions pourront l'être. reflété en outre par l'échelle. Cela signifie que nous devons réfléchir de manière extrême et réfléchir à ce à quoi ressemblera le modèle lorsque nous remplirons toutes les dimensions pouvant être remplies. 2.1 peut tout remplir La zone de saisie du modèle peut continuer à être allongée, la taille du modèle peut continuer à augmenter, les données du modèle peuvent continuer à augmenter, les données multimodales peut être fusionné, et le degré de spécialisation du modèle peut continuer à augmenter, et toutes ces dimensions peuvent continuer à être tirées vers le haut. Le modèle n'a pas encore atteint sa limite. La limite est un processus. Comment les capacités du modèle vont-elles se développer au cours de ce processus ? Ainsi, après une réflexion extrême, si toutes les dimensions qui peuvent être remplies sont remplies, le modèle est destiné à devenir de plus en plus fort, avec de plus en plus de capacités émergentes. 2.2 Inverser le processus intermédiaire Après avoir réfléchi clairement au processus limite, vous pouvez inverser le processus intermédiaire à partir de l'état limite. Par exemple, si nous voulons augmenter la taille de la zone de saisie : De cette façon, nous pouvons obtenir une de la technologie actuelle jusqu'à la limite de mise à l'échelle. 2.3 Productisation selon le processus d'évolution du modèle Les modèles évoluent constamment, mais la productisation n'a pas besoin d'attendre que le modèle final soit terminé - chaque fois qu'une grande version du modèle est itérée, elle peut être produit. Prenons l'exemple du processus de productisation d'OpenAI : En 2020, la formation GPT 3 de première génération a été achevée et l'API OpenAI a été ouverte Plus important encore, en suivant le processus d'évolution du modèle et en le produisant, vous pouvez vous adapter au marché pendant la phase de production. Apprenez la structure organisationnelle d'OpenAI pour promouvoir l'évolution du modèle lui-même, mais la production peut être basée sur les caractéristiques du marché local. Cette approche peut nous permettre de tirer des leçons de l’expérience avancée d’OpenAI tout en évitant le problème de l’acclimatation. 3. Le point auquel l'intelligence artificielle dépasse considérablement les humains De ce point de vue, l'intelligence artificielle dépassant les humains n'est pas une chose inimaginable. Cela nous amène à la question suivante : Comment contrôler une intelligence artificielle forte qui dépasse de loin les humains ? Ce problème est ce que la technologie d'alignement veut vraiment résoudre. Au stade actuel, les capacités du modèle, sauf qu'AlphaGo surpasse les humains les plus forts en Go, les autres IA n'ont pas dépassé les humains les plus forts (mais ChatGPT a peut-être surpassé les humains les plus forts en arts libéraux) 95 % de l'humanité, et elle continue de croître). Lorsque le modèle n'a pas dépassé les humains, la tâche d'Alignement est de rendre le modèle conforme aux valeurs et aux attentes humaines, mais une fois que le modèle continue d'évoluer pour dépasser les humains, la tâche d'Alignement consiste à trouver des moyens de contrôler les agents intelligents qui dépassent de loin les humains. les humains. 4.1 L'alignement comme méthode pour contrôler des agents intelligents bien au-delà des humains Une question évidente est la suivante : une fois que l'IA a dépassé les humains, peut-elle encore être rendue plus forte/plus contrainte grâce au feedback humain ? Est-ce hors de contrôle à ce stade ? Pas forcément. Même si le modèle est de loin supérieur aux humains, on peut quand même le contrôler. Un exemple ici est la relation entre athlètes et entraîneurs : les athlètes médaillés d'or sont déjà les humains les plus forts dans leur direction. , mais cela ne veut pas dire que l'entraîneur ne peut pas le former. Au contraire, même si l’entraîneur n’est pas aussi bon que l’athlète, il peut quand même rendre l’athlète plus fort et plus discipliné grâce à divers mécanismes de rétroaction. De même, la relation entre les humains et une intelligence artificielle forte peut devenir la relation entre les athlètes et les entraîneurs aux stades intermédiaires et ultérieurs du développement de l'IA. À l'heure actuelle, la capacité dont les humains ont besoin n'est pas d'atteindre un objectif , mais de fixer un bon objectif , puis de mesurer si la machine a suffisamment bien atteint l'objectif et de donner des suggestions d'amélioration. Les recherches dans ce sens sont encore très préliminaires. Le nom de cette nouvelle discipline s'appelle Scalable Oversight[15] 4.2 Alignement et structure organisationnelle Sur la voie d'un artificiel fort. En matière d'intelligence, non seulement les humains et l'IA doivent être alignés, mais les humains et les humains ont également besoin d'un haut degré d'alignement. Du point de vue de la structure organisationnelle, l'alignement implique : En 2017, lorsque je suis entré pour la première fois dans l'industrie de la PNL, j'ai consacré beaucoup d'efforts à la génération contrôlable. À cette époque, le soi-disant transfert de style de texte consistait à changer la classification des sentiments de la phrase. Changer le bon en mauvais était considéré comme un transfert complet. En 2018, j'ai passé beaucoup de temps à étudier comment laisser le modèle modifier le style des phrases du point de vue de la structure des phrases. J'ai un jour pensé à tort que la conversion de style était presque impossible à réaliser. ChatGPT rend désormais la conversion de style très simple. Des tâches qui semblaient autrefois impossibles, des choses qui étaient autrefois extrêmement difficiles, peuvent désormais être accomplies très facilement grâce à de grands modèles de langage. Tout au long de 2022, j'ai suivi toutes les itérations des versions de GPT-3 à GPT-3.5[11], et j'ai vu de mes propres yeux son évolution continue de faible à forte, étape par étape. Ce rythme d’évolution ne ralentit pas, mais s’accélère. Ce qui ressemblait autrefois à de la science-fiction est désormais devenu réalité. Qui sait ce que l’avenir nous réserve ? Le mil est séparé, les plants de riz poussent. Le rythme est lent et timide, et le centre tremble. Le mil est séparé, les épis du grain sont séparés. En avançant à grands pas, le centre est comme une ivresse. ———— "Le Livre des Chansons·Mili"
Si vous souhaitez continuer à augmenter la zone de saisie de cent mille à un million, vous aurez peut-être besoin de la méthode
4. Alignement
5. Conclusion
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!