


Le cours ChatGPT d'Andrew Ng est devenu viral : l'IA a renoncé à écrire des mots à l'envers, mais a compris le monde entier
Je ne m'attendais pas à ce que ChatGPT fasse encore des erreurs stupides à ce jour ?
Maître Andrew Ng l'a souligné lors du dernier cours :
ChatGPT n'inverse pas les mots !
Par exemple, si vous inversez le mot sucette, le résultat est pilollol, ce qui est complètement déroutant.
Oh, c'est en effet un peu surprenant.
À tel point qu'après qu'un internaute ait écouté le cours posté sur Reddit, celui-ci a immédiatement attiré un grand nombre de spectateurs, et le message a rapidement atteint 6 000 vues.
Et ce n'est pas un bug accidentel. Les internautes ont découvert que ChatGPT est en effet incapable de terminer cette tâche, et les résultats de nos tests personnels sont également les mêmes.
△Test réel ChatGPT (GPT-3.5)
Même de nombreux produits, dont Bard, Bing, Wen Xinyiyan, etc., ne fonctionnent pas.
△Test réel Bard
△Test réel Wen Xinyiyan
Certaines personnes ont suivi et se sont plaintes que ChatGPT est très mauvais pour gérer ces simples tâches de mots.
Par exemple, jouer au jeu de mots populaire Wordle a été un désastre et n'a jamais réussi.
hein ? Pourquoi est-ce ?
La clé réside dans le jeton
La clé de ce phénomène réside dans le jeton. Les grands modèles utilisent souvent des jetons pour traiter le texte, car les jetons sont les séquences de caractères les plus courantes dans le texte.
Il peut s'agir d'un mot entier ou d'un fragment de mot. Les grands modèles connaissent les relations statistiques entre ces jetons et peuvent habilement générer le jeton suivant.
Ainsi, lorsqu'il s'agit de la petite tâche d'inversion de mots, il peut s'agir simplement de retourner chaque jeton au lieu de la lettre.
C'est encore plus évident dans le contexte chinois : un mot est un jeton, ou un mot est un jeton.
Concernant l'exemple du début, quelqu'un a essayé de comprendre le processus de raisonnement de ChatGPT.
Pour une compréhension plus intuitive, OpenAI a même publié un Tokenizer GPT-3.
Par exemple, le mot sucette sera compris par GPT-3 comme trois parties : I, oll et ipop.
Basées sur l'expérience, certaines règles non écrites sont nées.
- 1 jeton≈4 caractères anglais≈trois quarts de mot ;
- 100 jetons≈75 mots ;
- 1-2 phrases≈30 jetons
- un paragraphe≈100 jetons, 1500 mots ≈ 2048 jetons ;
Plus le ratio jeton/caractère (jeton/mot) est élevé, plus le coût de traitement est élevé. Par conséquent, le traitement des tokens chinois est plus coûteux que celui de l’anglais.
Vous pouvez le comprendre de cette façon, le token est un moyen pour les grands modèles de comprendre le monde réel des humains. C'est très simple et réduit considérablement la complexité de la mémoire et du temps.
Mais il y a un problème avec la tokenisation des mots, ce qui rend difficile pour le modèle d'apprendre des représentations d'entrée significatives. La représentation la plus intuitive est qu'il ne peut pas comprendre la signification des mots.
Les transformateurs avaient été optimisés en conséquence à cette époque. Par exemple, un mot complexe et peu courant était divisé en un jeton significatif et un jeton indépendant.
Tout comme « ennuyeux » est divisé en deux parties : « ennuyeux » et « ly », le premier conserve son propre sens, tandis que le second est plus courant.
Cela a également abouti aux effets étonnants de ChatGPT et d'autres produits de grande taille aujourd'hui, qui peuvent très bien comprendre le langage humain.
Quant à l'incapacité de gérer une tâche aussi petite que l'inversion de mots, il existe naturellement une solution.
Le moyen le plus simple et le plus direct est de séparer d'abord les mots vous-même~
Ou vous pouvez laisser ChatGPT le faire étape par étape et symboliser d'abord chaque lettre.
Ou laissez-le écrire un programme qui inverse les lettres, et le résultat du programme sera correct. (tête de chien)
Cependant, GPT-4 peut également être utilisé, et il n'y a pas de problème de ce type dans les tests réels.
△ GPT-4 mesuré
En bref, le jeton est la pierre angulaire de la compréhension du langage naturel par l'IA.
En tant que pont permettant à l'IA de comprendre le langage naturel humain, l'importance des jetons est devenue de plus en plus évidente.
C'est devenu un déterminant clé des performances des modèles d'IA et la norme de facturation pour les grands modèles.
Il existe même de la littérature symbolique
Comme mentionné ci-dessus, les jetons peuvent faciliter la capture par le modèle d'informations sémantiques plus fines, telles que la signification des mots, l'ordre des mots, la structure grammaticale, etc. Dans les tâches de modélisation de séquences (telles que la modélisation du langage, la traduction automatique, la génération de texte, etc.), la position et l'ordre sont très importants pour la construction du modèle.
Ce n'est que lorsque le modèle comprend avec précision la position et le contexte de chaque jeton dans la séquence qu'il peut mieux prédire le contenu et donner un résultat raisonnable.
Par conséquent, la qualité et la quantité des jetons ont un impact direct sur l'effet du modèle.
À partir de cette année, lorsque de plus en plus de grands modèles seront publiés, le nombre de jetons sera souligné. Par exemple, les détails de l'exposition Google PaLM 2 mentionnaient qu'il utilisait 3,6 billions de jetons pour la formation.
Et de nombreux grands noms de l'industrie ont également déclaré que les jetons étaient vraiment cruciaux !
Andrej Karpathy, un scientifique en IA qui est passé de Tesla à OpenAI cette année, a déclaré dans son discours :
Plus de jetons peuvent permettre au modèle de mieux réfléchir.
Et il a souligné que les performances du modèle ne sont pas seulement déterminées par la taille du paramètre.
Par exemple, la taille des paramètres de LLaMA est beaucoup plus petite que celle de GPT-3 (65B contre 175B), mais comme il utilise plus de jetons pour l'entraînement (1,4T contre 300B), LLaMA est plus puissant.
Et avec son impact direct sur les performances des modèles, le token est également la norme de facturation pour les modèles d'IA.
Prenons l'exemple de la norme de tarification d'OpenAI. Ils facturent par unités de 1 000 jetons. Différents modèles et différents types de jetons ont des prix différents.
En bref, une fois que vous entrez dans le domaine des grands modèles d'IA, vous constaterez que le token est un point de connaissance incontournable.
Eh bien, la littérature symbolique a même été dérivée...
Cependant, il convient de mentionner que la traduction du jeton dans le monde chinois n'a pas encore été complètement déterminée.
La traduction littérale de « jeton » est toujours un peu bizarre.
GPT-4 pense qu'il vaut mieux l'appeler « élément de mot » ou « tag », qu'en pensez-vous ?
Lien de référence :
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/
[2]https://help.openai.com/en/ articles/4936856-que-sont-les-jetons-et-comment-les-compter
[3]https://openai.com/pricing
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Les dix principales applications de trading de devises virtuelles en 2025 sont les suivantes: 1. Okx, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Ce classement est basé sur des évaluations complètes telles que la sécurité, la liquidité, l'expérience utilisateur et la richesse des fonctionnalités.

Les dix principales applications de trading de devises virtuelles numériques en 2025 sont les suivantes: 1. Okx, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Ce classement est basé sur des évaluations complètes telles que la sécurité, la liquidité, l'expérience utilisateur et la richesse des fonctionnalités.

PI Network n'a pas encore officiellement lancé le commerce sur les bourses grand public. En 2024, PI est toujours au stade de la fermeture du réseau principal, et seuls certains échanges de petite et moyenne taille fournissent des transactions IOU. Le fonctionnaire n'autorise aucune transaction. Il est recommandé d'exploiter les canaux officiels et d'attendre que le réseau principal s'ouvre et échange sur des échanges conformes.

Depuis 2024, les principaux échanges qui soutiennent toujours la chaîne HECO ou les jetons HECO: 1. HTX (anciennement Huobi Huobi), soutient officiellement la chaîne HECO USDT et le trading de jetons; 2. MDEX, basé sur HECO DEX, prend en charge le trading de jetons de chaîne HECO; 3. Gate.io, soutient la réapprovisionnement et le retrait de certains jetons de chaîne HECO; 4. Kucoin, certains jetons de chaîne HECO peuvent encore être échangés; 5. Les échanges décentralisés tels que Pancakeswap et UNISWAP doivent réprimer les transactions, faire attention à la faible liquidité de la chaîne HECO et la migration du projet.

Résolvez le problème de l'interface tiers renvoyant 403 dans l'environnement Node.js. Lorsque nous utilisons Node.js pour appeler des interfaces tierces, nous rencontrons parfois une erreur de 403 à partir de l'interface renvoyant 403 ...

La méthode de traitement de l'échec de l'e-mail de Laravel à envoyer le code de vérification est d'utiliser Laravel ...

Comment définir automatiquement les autorisations d'UnixSocket après le redémarrage du système. Chaque fois que le système redémarre, nous devons exécuter la commande suivante pour modifier les autorisations d'UnixSocket: sudo ...

Dogecoin (DOGE) peut être évalué entre 0,1 et 1 à 2025, selon les cycles et les urgences du marché: 1. Le marché haussier et la poussée des muscs peuvent entraîner une augmentation de 0,5 à 0,5 $; 2. Les hausses modérées et les points positifs locaux peuvent provoquer des DOGE à 0,2 et 0,5 $; 3. Les marchés des ours et les coups réglementaires peuvent entraîner une chute de Doge à 0,05 à 0,1 $.
