Table des matières
Données binaires : l'ADN de base qui constitue le monde numérique
Des octets à tout : dépasser les frontières et évoluer vers une modélisation de données unifiée
Maison Périphériques technologiques IA Le LLM deviendra-t-il une histoire ? L'open source bGPT peut renverser le paradigme de l'apprentissage profond : simulez directement le binaire, ouvrant ainsi une nouvelle ère du monde numérique analogique !

Le LLM deviendra-t-il une histoire ? L'open source bGPT peut renverser le paradigme de l'apprentissage profond : simulez directement le binaire, ouvrant ainsi une nouvelle ère du monde numérique analogique !

Mar 13, 2024 pm 07:20 PM
模型 训练 模拟器

Dernière réalisation bGPT lancée par Microsoft Research Asia, ce modèle Transformer basé sur les octets nous ouvre une nouvelle porte pour explorer le monde numérique.

Contrairement aux modèles linguistiques traditionnels basés sur le vocabulaire, bGPT est unique en ce sens qu'il peut traiter directement des données binaires brutes sans être limité par des formats ou des tâches spécifiques. Son objectif est de simuler pleinement le monde numérique, ouvrant ainsi de nouvelles possibilités de développement de modèles.

Le LLM deviendra-t-il une histoire ? Lopen source bGPT peut renverser le paradigme de lapprentissage profond : simulez directement le binaire, ouvrant ainsi une nouvelle ère du monde numérique analogique !

Papier : https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

Code : https://www.php .cn/link/359499f804ea7988921bf86c9377fb95

Modèle : https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad

Page d'accueil du projet : https://www.php.cn/link/71af596 14c 8b42af334933e9261e53be

Dans leur document de recherche, l’équipe de recherche a démontré l’énorme potentiel du bGPT pour la modélisation. En effectuant un traitement au niveau des octets, bGPT peut non seulement générer du texte, des images et du son, mais également simuler le comportement de l'ordinateur, notamment des algorithmes de conversion de format et la modélisation des états du processeur. Cette approche consistant à traiter toutes les données comme une séquence d'octets permet à bGPT d'intégrer différents types de données dans le même cadre.

Une fois publié, l'article de bGPT a suscité un large débat sur X (Twitter), soulignant les changements potentiels dans les modèles d'apprentissage profond et ouvrant de nouvelles possibilités aux modèles pour véritablement comprendre et simuler diverses activités dans le monde numérique.

Données binaires : l'ADN de base qui constitue le monde numérique

Les données binaires sont la pierre angulaire du monde numérique. Elles traversent les processeurs informatiques et les systèmes d'exploitation des produits électroniques que nous utilisons quotidiennement, et en sont le cœur. données, appareils et logiciels. Par conséquent, sur la base de cette base, l’objectif de bGPT est de comprendre la logique interne des systèmes numériques en étudiant des séquences de données binaires, remodelant et simulant ainsi divers phénomènes numériques complexes.

bGPT peut non seulement être appliqué aux tâches conventionnelles de génération et de compréhension d'IA via un traitement au niveau des octets, mais peut également gérer des applications plus non traditionnelles. Par exemple, il peut simuler directement le MIDI – un format standard pour la transmission et le stockage de musique, dont les recherches antérieures ont évité la modélisation directe en raison de la nature binaire du MIDI.

Mais bGPT est naturellement adapté à de telles tâches et peut simuler avec précision l'algorithme de conversion des données musicales, atteignant un taux d'erreur extrêmement faible (0,0011 BPB) lors de la conversion de la notation ABC au format MIDI.

Dans les applications pratiques, bGPT est généralement capable d'effectuer avec précision la conversion entre les symboles ABC et les fichiers MIDI, et peut parfois même corriger les erreurs dans les fichiers originaux pour rendre la conversion musicale plus précise.

Le LLM deviendra-t-il une histoire ? Lopen source bGPT peut renverser le paradigme de lapprentissage profond : simulez directement le binaire, ouvrant ainsi une nouvelle ère du monde numérique analogique !


bGPT convertit automatiquement la notation ABC au format MIDI (ci-dessus). La comparaison avec les données MIDI originales (ci-dessous) met en évidence la différence clé : bien qu'il manque un battement aux données MIDI originales (voir l'image ci-dessous). ), provoquant la déconnexion de l'accompagnement d'accords, mais le résultat converti par bGPT (voir l'image ci-dessus) comble correctement cette lacune, garantissant la douceur de l'accompagnement d'accords.

L'équipe de recherche considère également la modélisation du processeur comme une tâche représentative de la simulation du comportement du matériel : cette tâche nécessite que le modèle reçoive une séquence d'instructions machine de bas niveau en entrée, et son objectif est de prédire avec précision l'état du processeur. mis à jour après l'exécution de chaque instruction jusqu'à l'arrêt du programme.

Dans cette tâche, bGPT a démontré une précision de plus de 99,99 %, démontrant la puissance et l'évolutivité du modèle d'octets dans le traitement des données binaires natives.

Le LLM deviendra-t-il une histoire ? Lopen source bGPT peut renverser le paradigme de lapprentissage profond : simulez directement le binaire, ouvrant ainsi une nouvelle ère du monde numérique analogique !

Compte tenu du programme et de l'état initial du processeur, bGPT est capable de prédire avec précision le processus complet d'exécution du processeur jusqu'à la fin du programme. Dans cet exemple, bGPT gère toutes les instructions du processeur avec précision. Pour faciliter la compréhension, la séquence d'octets réelle est convertie dans un format plus lisible.

Des octets à tout : dépasser les frontières et évoluer vers une modélisation de données unifiée

bGPT peut non seulement traiter des données binaires natives, mais également intégrer plusieurs types de données dans une architecture de modèle unifiée, traitant toutes les données comme une séquence d'octets.

Cette approche simplifie non seulement le processus de modélisation des données, mais facilite également l'intégration à partir de n'importe quelle source de données sans avoir besoin de personnaliser les modèles pour des types de données spécifiques.

L'équipe de recherche a donné des exemples de fichiers texte, image et audio traditionnels dans l'article, démontrant les capacités de bGPT en matière de modélisation de données unifiée. Le modèle bGPT qu’ils ont formé comporte environ 100 millions de paramètres.

Les résultats expérimentaux montrent qu'en comparaison avec des modèles de même taille que GPT-2 (modèle texte), ViT (modèle visuel) et AST (modèle audio), bGPT montre des performances comparables sur différents types de données.

bGPT fonctionne très bien dans la génération de texte. Grâce à son codage de texte au niveau octet, le modèle ne s'appuie pas sur le vocabulaire et peut donc prendre en charge toutes les langues.

Son architecture Transformer en couches, bien que la charge de calcul soit similaire à celle de GPT-2, peut générer du texte jusqu'à 8 Ko, ce qui dépasse largement la limite de longueur de GPT-2. Après une pré-formation sur les données Wikipédia, le texte généré par bGPT est comparable à GPT-2 en termes de style et de sujet, prouvant sa puissante capacité de génération de texte.

bGPT est pré-entraîné sur l'ensemble de données Wikipédia, et la qualité et la cohérence thématique des échantillons de texte générés sont comparables à GPT-2.

bGPT peut générer des images en prédisant l'octet suivant dans une séquence d'octets d'image. Le modèle est pré-entraîné sur l'ensemble de données ImageNet et les images générées ont une résolution de 32 x 32 pixels.

Bien qu'il soit difficile de capturer avec précision la relation spatiale bidimensionnelle des images à travers des séquences d'octets à l'échelle actuelle, ce qui entraîne des artefacts et du bruit dans les images générées, la texture et les effets de lumière et d'ombre sont généralement relativement précis.

De plus, ces images générées peuvent être décodées normalement en fichiers BMP. L'équipe de recherche a souligné qu'en élargissant l'échelle du bGPT, similaire à la méthode de modélisation de séquences de pixels d'iGPT développée par OpenAI, il pourrait être possible d'obtenir une génération d'images de meilleure qualité et plus réaliste.

Il s'agit d'un ensemble d'images générées par bGPT pré-entraînées sur l'ensemble de données ImageNet. Bien que la texture et les effets d’éclairage des images soient généralement précis, l’identification des principaux objets dans ces images générées peut s’avérer difficile.

bGPT traite les données audio comme une séquence d'octets et peut générer des échantillons audio d'une seconde avec un taux d'échantillonnage de 8 000 Hz.

Le modèle a été pré-entraîné sur l'ensemble de données LibriSpeech, puis affiné et démontré sur l'ensemble de données Speech Commands v2. Les échantillons audio générés par bGPT maintiennent un haut niveau de précision, certains échantillons étant presque impossibles à distinguer de l'audio réel. Ce qui suit est un ensemble d'exemples démontrant les capacités de bGPT dans le domaine de la génération audio.

Explorez le monde numérique des octets avec bGPT

Les modèles de langage traditionnels, aussi puissants soient-ils, se concentrent principalement sur le traitement du texte en langage naturel. Le modèle bGPT brise les limitations du traitement de texte grâce à un mécanisme de traitement basé sur les octets et ouvre une nouvelle catégorie de traitement de données.

Cette avancée donne à bGPT la capacité de traiter de manière transparente divers types de données, notamment le texte, les images, l'audio et même les données binaires natives provenant d'algorithmes et de matériel, ouvrant la voie à une simulation et une compréhension complètes du monde numérique.

Bien que bGPT ait démontré des capacités convaincantes, il présente des limites en termes de surcharge de calcul, par exemple en ne pouvant actuellement traiter que des séquences d'octets allant jusqu'à 8 Ko sur des cartes graphiques conventionnelles. données, En termes d’application, cela constitue des limites évidentes. Les plans de travail futurs se concentreront sur le développement d’algorithmes plus efficaces et sur l’exploitation des avancées matérielles, dans le but d’améliorer la capacité à traiter des séquences de données plus volumineuses.

Les passionnés de technologie du monde entier ont commencé à se réjouir du potentiel futur du bGPT, de l'optimisation de l'élagage des réseaux et de l'auto-apprentissage aux capacités d'auto-reconfiguration des réseaux à très grande échelle. Ces discussions pointent vers un point commun. Vision : bGPT pourrait éventuellement réaliser un modèle unifié capable de traiter et de produire tous les types de données d'octets, devenant ainsi un véritable simulateur complet du monde numérique.

Le LLM deviendra-t-il une histoire ? Lopen source bGPT peut renverser le paradigme de lapprentissage profond : simulez directement le binaire, ouvrant ainsi une nouvelle ère du monde numérique analogique !

L'équipe de recherche a open source le code et le modèle de bGPT. Cela signifie que vous pouvez entraîner directement bGPT sur votre propre ensemble de données sans apporter aucun ajustement à l'architecture du modèle, et explorer les larges perspectives des modèles d'octets dans le domaine numérique.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Introduction à l'utilisation du simulateur joiplay Introduction à l'utilisation du simulateur joiplay May 04, 2024 pm 06:40 PM

Le simulateur jojplay est un simulateur de téléphone mobile très facile à utiliser. Il prend en charge les jeux informatiques et peut être exécuté sur les téléphones mobiles, et la compatibilité est très bonne. Certains joueurs ne savent pas comment l'utiliser. comment l'utiliser. Comment utiliser le simulateur joiplay 1. Tout d'abord, vous devez télécharger le plug-in Joiplay body et RPGM. Il est préférable de les installer dans l'ordre body - plug-in. Le package apk peut être obtenu dans la barre Joiplay (. cliquez pour obtenir >>>). 2. Une fois Android terminé, vous pouvez ajouter des jeux dans le coin inférieur gauche. 3. Remplissez le nom avec désinvolture et appuyez sur CHOISIR sur le fichier exécutable pour sélectionner le fichier game.exe du jeu. 4. L'icône peut rester vide ou vous pouvez choisir votre image préférée.

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Guide du simulateur de redémarrage de la vie Guide du simulateur de redémarrage de la vie May 07, 2024 pm 05:28 PM

Life Restart Simulator est un jeu de simulation très intéressant. Ce jeu est devenu très populaire récemment. Il existe de nombreuses façons de jouer au jeu. Ci-dessous, l'éditeur vous propose un guide complet de Life Restart Simulator. les stratégies existent-elles ? Guide du Life Restart Simulator Guide Caractéristiques du Life Restart Simulator Il s'agit d'un jeu très créatif dans lequel les joueurs peuvent jouer selon leurs propres idées. Il y a de nombreuses tâches à accomplir chaque jour et vous pouvez profiter d'une nouvelle vie dans ce monde virtuel. Il y a de nombreuses chansons dans le jeu et toutes sortes de vies différentes vous attendent. Contenu du jeu Life Restart Simulator Cartes de dessin de talents : Talent : Vous devez choisir la mystérieuse petite boîte pour devenir un immortel. Une variété de petites capsules sont disponibles pour éviter de mourir à mi-chemin. Cthulhu peut choisir

La version Kuaishou de Sora 'Ke Ling' est ouverte aux tests : génère plus de 120 s de vidéo, comprend mieux la physique et peut modéliser avec précision des mouvements complexes La version Kuaishou de Sora 'Ke Ling' est ouverte aux tests : génère plus de 120 s de vidéo, comprend mieux la physique et peut modéliser avec précision des mouvements complexes Jun 11, 2024 am 09:51 AM

Quoi? Zootopie est-elle concrétisée par l’IA domestique ? Avec la vidéo est exposé un nouveau modèle de génération vidéo domestique à grande échelle appelé « Keling ». Sora utilise une voie technique similaire et combine un certain nombre d'innovations technologiques auto-développées pour produire des vidéos qui comportent non seulement des mouvements larges et raisonnables, mais qui simulent également les caractéristiques du monde physique et possèdent de fortes capacités de combinaison conceptuelle et d'imagination. Selon les données, Keling prend en charge la génération de vidéos ultra-longues allant jusqu'à 2 minutes à 30 ips, avec des résolutions allant jusqu'à 1080p, et prend en charge plusieurs formats d'image. Un autre point important est que Keling n'est pas une démo ou une démonstration de résultats vidéo publiée par le laboratoire, mais une application au niveau produit lancée par Kuaishou, un acteur leader dans le domaine de la vidéo courte. De plus, l'objectif principal est d'être pragmatique, de ne pas faire de chèques en blanc et de se mettre en ligne dès sa sortie. Le grand modèle de Ke Ling est déjà sorti à Kuaiying.

L'US Air Force présente son premier avion de combat IA de grande envergure ! Le ministre a personnellement effectué l'essai routier sans intervenir pendant tout le processus, et 100 000 lignes de code ont été testées 21 fois. L'US Air Force présente son premier avion de combat IA de grande envergure ! Le ministre a personnellement effectué l'essai routier sans intervenir pendant tout le processus, et 100 000 lignes de code ont été testées 21 fois. May 07, 2024 pm 05:00 PM

Récemment, le milieu militaire a été submergé par la nouvelle : les avions de combat militaires américains peuvent désormais mener des combats aériens entièrement automatiques grâce à l'IA. Oui, tout récemment, l’avion de combat IA de l’armée américaine a été rendu public pour la première fois, dévoilant ainsi son mystère. Le nom complet de ce chasseur est Variable Stability Simulator Test Aircraft (VISTA). Il a été personnellement piloté par le secrétaire de l'US Air Force pour simuler une bataille aérienne en tête-à-tête. Le 2 mai, le secrétaire de l'US Air Force, Frank Kendall, a décollé à bord d'un X-62AVISTA à la base aérienne d'Edwards. Notez que pendant le vol d'une heure, toutes les actions de vol ont été effectuées de manière autonome par l'IA ! Kendall a déclaré : "Au cours des dernières décennies, nous avons réfléchi au potentiel illimité du combat air-air autonome, mais cela a toujours semblé hors de portée." Mais maintenant,

Introduction à la méthode de configuration des polices du simulateur Joiplay Introduction à la méthode de configuration des polices du simulateur Joiplay May 09, 2024 am 08:31 AM

Le simulateur Jojplay peut réellement personnaliser les polices du jeu et résoudre le problème des caractères manquants et des caractères encadrés dans le texte. Je suppose que de nombreux joueurs ne savent toujours pas comment l'utiliser. L'éditeur suivant vous apportera la méthode de configuration. police du simulateur jojplay introduire. Comment définir la police du simulateur Joiplay 1. Ouvrez d'abord le simulateur Joiplay, cliquez sur les paramètres (trois points) dans le coin supérieur droit et recherchez-le. 2. Dans la colonne RPGMSettings, cliquez pour sélectionner la police personnalisée CustomFont dans la troisième ligne. 3. Sélectionnez le fichier de police et cliquez sur OK. Veillez à ne pas cliquer sur l'icône "Enregistrer" dans le coin inférieur droit, sinon les paramètres par défaut seront restaurés. 4. Recommander le chinois simplifié Founder et Quasi-Yuan (déjà dans les dossiers des jeux Fuxing et Rebirth). joi

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

See all articles