Table des matières
△Test réel ChatGPT (GPT-3.5)
△Test réel Bard
△Test réel Wen Xinyiyan
La clé réside dans le jeton
△ GPT-4 mesuré
Il existe même de la littérature symbolique
Maison Périphériques technologiques IA Le cours ChatGPT d'Andrew Ng est devenu viral : l'IA a renoncé à écrire des mots à l'envers, mais a compris le monde entier

Le cours ChatGPT d'Andrew Ng est devenu viral : l'IA a renoncé à écrire des mots à l'envers, mais a compris le monde entier

Jun 03, 2023 pm 09:27 PM
ai token

Je ne m'attendais pas à ce que ChatGPT fasse encore des erreurs stupides à ce jour ?

Maître Andrew Ng l'a souligné lors du dernier cours :

ChatGPT n'inverse pas les mots !

Par exemple, si vous inversez le mot sucette, le résultat est pilollol, ce qui est complètement déroutant.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Oh, c'est en effet un peu surprenant.

À tel point qu'après qu'un internaute ait écouté le cours posté sur Reddit, celui-ci a immédiatement attiré un grand nombre de spectateurs, et le message a rapidement atteint 6 000 vues.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Et ce n'est pas un bug accidentel. Les internautes ont découvert que ChatGPT est en effet incapable de terminer cette tâche, et les résultats de nos tests personnels sont également les mêmes.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

△Test réel ChatGPT (GPT-3.5)

Même de nombreux produits, dont Bard, Bing, Wen Xinyiyan, etc., ne fonctionnent pas.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

△Test réel Bard

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

△Test réel Wen Xinyiyan

Certaines personnes ont suivi et se sont plaintes que ChatGPT est très mauvais pour gérer ces simples tâches de mots.

Par exemple, jouer au jeu de mots populaire Wordle a été un désastre et n'a jamais réussi.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

hein ? Pourquoi est-ce ?

La clé réside dans le jeton

La clé de ce phénomène réside dans le jeton. Les grands modèles utilisent souvent des jetons pour traiter le texte, car les jetons sont les séquences de caractères les plus courantes dans le texte.

Il peut s'agir d'un mot entier ou d'un fragment de mot. Les grands modèles connaissent les relations statistiques entre ces jetons et peuvent habilement générer le jeton suivant.

Ainsi, lorsqu'il s'agit de la petite tâche d'inversion de mots, il peut s'agir simplement de retourner chaque jeton au lieu de la lettre.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

C'est encore plus évident dans le contexte chinois : un mot est un jeton, ou un mot est un jeton.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Concernant l'exemple du début, quelqu'un a essayé de comprendre le processus de raisonnement de ChatGPT.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Pour une compréhension plus intuitive, OpenAI a même publié un Tokenizer GPT-3.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Par exemple, le mot sucette sera compris par GPT-3 comme trois parties : I, oll et ipop.

Basées sur l'expérience, certaines règles non écrites sont nées.

  • 1 jeton≈4 caractères anglais≈trois quarts de mot ;
  • 100 jetons≈75 mots ;
  • 1-2 phrases≈30 jetons
  • un paragraphe≈100 jetons, 1500 mots ≈ 2048 jetons ;
La façon dont les mots sont divisés dépend également de la langue. Quelqu'un a déjà calculé que le nombre de jetons utilisés en chinois était de 1,2 à 2,7 fois supérieur à celui de l'anglais.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier


Plus le ratio jeton/caractère (jeton/mot) est élevé, plus le coût de traitement est élevé. Par conséquent, le traitement des tokens chinois est plus coûteux que celui de l’anglais.

Vous pouvez le comprendre de cette façon, le token est un moyen pour les grands modèles de comprendre le monde réel des humains. C'est très simple et réduit considérablement la complexité de la mémoire et du temps.

Mais il y a un problème avec la tokenisation des mots, ce qui rend difficile pour le modèle d'apprendre des représentations d'entrée significatives. La représentation la plus intuitive est qu'il ne peut pas comprendre la signification des mots.

Les transformateurs avaient été optimisés en conséquence à cette époque. Par exemple, un mot complexe et peu courant était divisé en un jeton significatif et un jeton indépendant.

Tout comme « ennuyeux » est divisé en deux parties : « ennuyeux » et « ly », le premier conserve son propre sens, tandis que le second est plus courant.

Cela a également abouti aux effets étonnants de ChatGPT et d'autres produits de grande taille aujourd'hui, qui peuvent très bien comprendre le langage humain.

Quant à l'incapacité de gérer une tâche aussi petite que l'inversion de mots, il existe naturellement une solution.

Le moyen le plus simple et le plus direct est de séparer d'abord les mots vous-même~

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Ou vous pouvez laisser ChatGPT le faire étape par étape et symboliser d'abord chaque lettre.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Ou laissez-le écrire un programme qui inverse les lettres, et le résultat du programme sera correct. (tête de chien)

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Cependant, GPT-4 peut également être utilisé, et il n'y a pas de problème de ce type dans les tests réels.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

△ GPT-4 mesuré

En bref, le jeton est la pierre angulaire de la compréhension du langage naturel par l'IA.

En tant que pont permettant à l'IA de comprendre le langage naturel humain, l'importance des jetons est devenue de plus en plus évidente.

C'est devenu un déterminant clé des performances des modèles d'IA et la norme de facturation pour les grands modèles.

Il existe même de la littérature symbolique

Comme mentionné ci-dessus, les jetons peuvent faciliter la capture par le modèle d'informations sémantiques plus fines, telles que la signification des mots, l'ordre des mots, la structure grammaticale, etc. Dans les tâches de modélisation de séquences (telles que la modélisation du langage, la traduction automatique, la génération de texte, etc.), la position et l'ordre sont très importants pour la construction du modèle.

Ce n'est que lorsque le modèle comprend avec précision la position et le contexte de chaque jeton dans la séquence qu'il peut mieux prédire le contenu et donner un résultat raisonnable.

Par conséquent, la qualité et la quantité des jetons ont un impact direct sur l'effet du modèle.

À partir de cette année, lorsque de plus en plus de grands modèles seront publiés, le nombre de jetons sera souligné. Par exemple, les détails de l'exposition Google PaLM 2 mentionnaient qu'il utilisait 3,6 billions de jetons pour la formation.

Et de nombreux grands noms de l'industrie ont également déclaré que les jetons étaient vraiment cruciaux !

Andrej Karpathy, un scientifique en IA qui est passé de Tesla à OpenAI cette année, a déclaré dans son discours :

Plus de jetons peuvent permettre au modèle de mieux réfléchir.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Et il a souligné que les performances du modèle ne sont pas seulement déterminées par la taille du paramètre.

Par exemple, la taille des paramètres de LLaMA est beaucoup plus petite que celle de GPT-3 (65B contre 175B), mais comme il utilise plus de jetons pour l'entraînement (1,4T contre 300B), LLaMA est plus puissant.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Et avec son impact direct sur les performances des modèles, le token est également la norme de facturation pour les modèles d'IA.

Prenons l'exemple de la norme de tarification d'OpenAI. Ils facturent par unités de 1 000 jetons. Différents modèles et différents types de jetons ont des prix différents.

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

En bref, une fois que vous entrez dans le domaine des grands modèles d'IA, vous constaterez que le token est un point de connaissance incontournable.

Eh bien, la littérature symbolique a même été dérivée...

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Cependant, il convient de mentionner que la traduction du jeton dans le monde chinois n'a pas encore été complètement déterminée.

La traduction littérale de « jeton » est toujours un peu bizarre.

GPT-4 pense qu'il vaut mieux l'appeler « élément de mot » ou « tag », qu'en pensez-vous ?

Le cours ChatGPT dAndrew Ng est devenu viral : lIA a renoncé à écrire des mots à lenvers, mais a compris le monde entier

Lien de référence :
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/
[2]https://help.openai.com/en/ articles/4936856-que-sont-les-jetons-et-comment-les-compter
[3]https://openai.com/pricing

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Les derniers classements des dix principaux échanges d'applications de monnaie virtuelle dans le cercle de devises 2025 Les derniers classements des dix principaux échanges d'applications de monnaie virtuelle dans le cercle de devises 2025 Mar 27, 2025 pm 07:27 PM

Les dix principales applications de trading de devises virtuelles en 2025 sont les suivantes: 1. Okx, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Ce classement est basé sur des évaluations complètes telles que la sécurité, la liquidité, l'expérience utilisateur et la richesse des fonctionnalités.

Un résumé des dix principaux applications d'applications d'échange de devises virtuelles numériques en 2025 Un résumé des dix principaux applications d'applications d'échange de devises virtuelles numériques en 2025 Mar 27, 2025 pm 07:18 PM

Les dix principales applications de trading de devises virtuelles numériques en 2025 sont les suivantes: 1. Okx, 2. Binance, 3. Gate.io, 4. Bybit, 5. Kraken, 6. Kucoin, 7. Bitget, 8. Htx, 9. Mexc, 10. Coinbase. Ce classement est basé sur des évaluations complètes telles que la sécurité, la liquidité, l'expérience utilisateur et la richesse des fonctionnalités.

Quels échanges publient des nouvelles pi Quels échanges publient des nouvelles pi Mar 28, 2025 pm 03:33 PM

PI Network n'a pas encore officiellement lancé le commerce sur les bourses grand public. En 2024, PI est toujours au stade de la fermeture du réseau principal, et seuls certains échanges de petite et moyenne taille fournissent des transactions IOU. Le fonctionnaire n'autorise aucune transaction. Il est recommandé d'exploiter les canaux officiels et d'attendre que le réseau principal s'ouvre et échange sur des échanges conformes.

Que les échanges prennent en charge HECO Que les échanges prennent en charge HECO Mar 28, 2025 pm 03:36 PM

Depuis 2024, les principaux échanges qui soutiennent toujours la chaîne HECO ou les jetons HECO: 1. HTX (anciennement Huobi Huobi), soutient officiellement la chaîne HECO USDT et le trading de jetons; 2. MDEX, basé sur HECO DEX, prend en charge le trading de jetons de chaîne HECO; 3. Gate.io, soutient la réapprovisionnement et le retrait de certains jetons de chaîne HECO; 4. Kucoin, certains jetons de chaîne HECO peuvent encore être échangés; 5. Les échanges décentralisés tels que Pancakeswap et UNISWAP doivent réprimer les transactions, faire attention à la faible liquidité de la chaîne HECO et la migration du projet.

Comment résoudre le problème de l'interface tiers renvoyant 403 dans l'environnement Node.js? Comment résoudre le problème de l'interface tiers renvoyant 403 dans l'environnement Node.js? Mar 31, 2025 pm 11:27 PM

Résolvez le problème de l'interface tiers renvoyant 403 dans l'environnement Node.js. Lorsque nous utilisons Node.js pour appeler des interfaces tierces, nous rencontrons parfois une erreur de 403 à partir de l'interface renvoyant 403 ...

Dans Laravel, comment gérer la situation où les codes de vérification ne sont pas envoyés par e-mail? Dans Laravel, comment gérer la situation où les codes de vérification ne sont pas envoyés par e-mail? Mar 31, 2025 pm 11:48 PM

La méthode de traitement de l'échec de l'e-mail de Laravel à envoyer le code de vérification est d'utiliser Laravel ...

Comment définir automatiquement les autorisations d'UnixSocket après le redémarrage du système? Comment définir automatiquement les autorisations d'UnixSocket après le redémarrage du système? Mar 31, 2025 pm 11:54 PM

Comment définir automatiquement les autorisations d'UnixSocket après le redémarrage du système. Chaque fois que le système redémarre, nous devons exécuter la commande suivante pour modifier les autorisations d'UnixSocket: sudo ...

Combien augmentera Dogecoin en 2025 Combien augmentera Dogecoin en 2025 Mar 28, 2025 pm 03:48 PM

Dogecoin (DOGE) peut être évalué entre 0,1 et 1 à 2025, selon les cycles et les urgences du marché: 1. Le marché haussier et la poussée des muscs peuvent entraîner une augmentation de 0,5 à 0,5 $; 2. Les hausses modérées et les points positifs locaux peuvent provoquer des DOGE à 0,2 et 0,5 $; 3. Les marchés des ours et les coups réglementaires peuvent entraîner une chute de Doge à 0,05 à 0,1 $.

See all articles