


WizardLM-2, qui est « très proche de GPT-4 », a été retiré en urgence par Microsoft. Quelle est l'histoire intérieure ?
Il y a quelque temps, Microsoft a commis sa propre erreur : il a largement ouvert WizardLM-2, puis l'a retiré proprement peu de temps après.
Informations de version actuellement disponibles pour WizardLM-2, un grand modèle open source « vraiment comparable à GPT-4 » avec des performances améliorées en matière de chat complexe, multilingue, d'inférence et d'agence.
La série comprend trois modèles : WizardLM-2 8x22B, WizardLM-2 70B et WizardLM-2 7B. Parmi eux :
- WizardLM-2 8x22B est le modèle le plus avancé et le meilleur LLM open source basé sur une évaluation interne pour des tâches très complexes.
- WizardLM-2 70B possède des capacités d'inférence de haut niveau et constitue le premier choix à cette échelle.
- WizardLM-2 7B est le plus rapide, avec des performances comparables aux principaux modèles open source existants qui sont 10 fois plus grands.
De plus, grâce à l'évaluation des préférences humaines, les capacités de WizardLM-28x22B "ne sont que légèrement en retard par rapport à l'aperçu GPT-4-1106, mais nettement supérieures à celles de CommandRPlus et GPT4-0314
".
Est-ce que cela deviendra une autre étape importante de l'open source comme LLaMa 3 ?
Alors que tout le monde était occupé à télécharger le modèle, l'équipe a soudainement tout retiré : blog, GitHub, HuggingFace ont tous obtenu 404.
Source de l'image : https://wizardlm.github.io/WizardLM2/
L'explication de l'équipe est :
Bonjour à tous les amis de Huggingface ! Désolé, nous avons supprimé le modèle. Cela fait un moment que nous n'avons pas publié de modèle il y a quelques mois, nous ne sommes donc pas familiers avec le nouveau processus de publication : nous avons accidentellement oublié un élément nécessaire dans le processus de publication du modèle : les tests de toxicité. C’est une étape que tous les nouveaux modèles doivent actuellement franchir.
Nous terminons actuellement ce test rapidement et rééditerons notre modèle dès que possible. Ne vous inquiétez pas, merci de votre sollicitude et de votre compréhension.
Mais l'attention et les discussions de la communauté de l'IA sur WizardLM-2 ne se sont pas arrêtées. Il y a plusieurs doutes :
Premièrement, les projets open source supprimés ne sont pas seulement WizardLM-2, l'équipe Tous les travaux de la série Wizard ont disparu, y compris les précédents WizardMath et WizardCoder.
Deuxièmement, certaines personnes se sont demandé pourquoi le blog avait également été supprimé lorsque les poids des modèles étaient supprimés ? S’il manque juste la partie test, il n’est pas nécessaire de la retirer complètement.
L'explication de l'équipe est : « Selon la réglementation en vigueur, quelle est la réglementation spécifique ? Personne ne le sait encore.
Troisièmement, il y a également des spéculations selon lesquelles l'équipe derrière WizardLM a été licenciée et le retrait du projet de la série Wizard a également été forcé.
Cependant, cette spéculation a été démentie par l'équipe :
Source : https://x.com/_Mira___Mira_/status/1783716276944486751
Source photo : https ://x.com/DavidFSWD/status/1783682898786152470
Et maintenant on cherche le nom de l'auteur, et il n'a pas complètement disparu du site officiel de Microsoft :
Source : https://www .microsoft.com/en-us/research/people/qins/
Quatrièmement, certaines personnes pensent que Microsoft a retiré ce modèle open source, d'une part parce que les performances sont trop proches de GPT-4, et d'autre part à cause des problèmes techniques. feuille de route avec OpenAI " Crash".
Quel est l'itinéraire spécifique ? Nous pouvons jeter un œil aux détails techniques de la page du blog originale.
L'équipe a déclaré que grâce à la formation LLM, les données générées par l'homme dans la nature sont de plus en plus épuisées, et que les données soigneusement créées par l'IA et les modèles supervisés par l'IA étape par étape seront le seul moyen d'obtenir une IA plus puissante.
Au cours de la dernière année, l'équipe Microsoft a construit un système de formation synthétique entièrement alimenté par l'intelligence artificielle, comme le montre la figure ci-dessous.
est grossièrement divisé en plusieurs sections :
Prétraitement des données :
- Analyse des données : Utilisez ce pipeline pour obtenir la distribution des différents attributs des nouvelles données sources, ce qui aide à avoir une compréhension préliminaire des données.
- Échantillonnage pondéré : la distribution des données d'entraînement optimales est souvent incompatible avec la distribution naturelle du corpus de discussion humaine. Il est nécessaire d'ajuster le poids de chaque attribut dans les données d'entraînement en fonction de l'expérience expérimentale.
Evol Lab :
- Evol-Instruct : De nombreux efforts ont été déployés pour réévaluer divers problèmes liés à la méthode Evol-Instruct originale et les réorganiser. Modifications initiales , la nouvelle méthode permet à divers agents de générer automatiquement des instructions de haute qualité.
- Evol-Answer : guidez le modèle pour générer et réécrire des réponses plusieurs fois, ce qui peut améliorer sa logique, son exactitude et son affinité.
AI Align AI (AAA) :
- Co-enseignement : collectez WizardLM et divers modèles de pointe open source et propriétaires autorisés, puis laissez-les enseigner ensemble et s'améliorer chacun autres. Le contenu pédagogique comprend un chat de simulation, des évaluations de qualité, des suggestions d'amélioration, la réduction des lacunes en matière de compétences, etc.
- Auto-apprentissage : WizardLM peut générer de nouvelles données d'entraînement évolutives pour l'apprentissage supervisé et des données de préférence pour l'apprentissage par renforcement grâce à l'apprentissage par activation.
Apprentissage :
- Apprentissage supervisé.
- Phase - DPO : Afin d'effectuer plus efficacement un apprentissage par renforcement hors ligne, les données préférées sont divisées en différents fragments et le modèle est amélioré étape par étape.
- RLEIF : Utilisation d'une méthode qui combine le modèle de récompense de la qualité de l'instruction (IRM) et le modèle de récompense de la supervision des processus (PRM) pour obtenir une exactitude plus précise dans l'apprentissage par renforcement en ligne.
La dernière chose que je veux dire, c'est que toute spéculation est vaine, attendons avec impatience le retour de WizardLM-2.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds



Les problèmes de «chargement» PS sont causés par des problèmes d'accès aux ressources ou de traitement: la vitesse de lecture du disque dur est lente ou mauvaise: utilisez Crystaldiskinfo pour vérifier la santé du disque dur et remplacer le disque dur problématique. Mémoire insuffisante: améliorez la mémoire pour répondre aux besoins de PS pour les images à haute résolution et le traitement complexe de couche. Les pilotes de la carte graphique sont obsolètes ou corrompues: mettez à jour les pilotes pour optimiser la communication entre le PS et la carte graphique. Les chemins de fichier sont trop longs ou les noms de fichiers ont des caractères spéciaux: utilisez des chemins courts et évitez les caractères spéciaux. Problème du PS: réinstaller ou réparer le programme d'installation PS.

Un PS est coincé sur le "chargement" lors du démarrage peut être causé par diverses raisons: désactiver les plugins corrompus ou conflictuels. Supprimer ou renommer un fichier de configuration corrompu. Fermez des programmes inutiles ou améliorez la mémoire pour éviter une mémoire insuffisante. Passez à un entraînement à semi-conducteurs pour accélérer la lecture du disque dur. Réinstaller PS pour réparer les fichiers système corrompus ou les problèmes de package d'installation. Afficher les informations d'erreur pendant le processus de démarrage de l'analyse du journal d'erreur.

Le bégaiement "Chargement" se produit lors de l'ouverture d'un fichier sur PS. Les raisons peuvent inclure: un fichier trop grand ou corrompu, une mémoire insuffisante, une vitesse du disque dur lente, des problèmes de pilote de carte graphique, des conflits de version PS ou du plug-in. Les solutions sont: vérifier la taille et l'intégrité du fichier, augmenter la mémoire, mettre à niveau le disque dur, mettre à jour le pilote de carte graphique, désinstaller ou désactiver les plug-ins suspects et réinstaller PS. Ce problème peut être résolu efficacement en vérifiant progressivement et en faisant bon usage des paramètres de performances PS et en développant de bonnes habitudes de gestion des fichiers.

Méthode de production d'effet transparent: Utilisez l'outil de sélection et les plumes pour coopérer: sélectionnez les zones transparentes et les plumes pour adoucir les bords; Modifiez le mode de mélange de couche et l'opacité pour contrôler la transparence. Utilisez des masques et des plumes: Sélectionnez et des zones de plumes; Ajouter les masques de couche et la transparence de contrôle du gradient de niveaux de gris.

Bootstrap Image Centering fait face à des problèmes de compatibilité. La solution est la suivante: Utilisez MX-Auto pour centrer l'image horizontalement pour l'affichage: Block. Le centrage vertical utilise des dispositions Flexbox ou Grid pour garantir que l'élément parent est centré verticalement pour aligner les éléments enfants. Pour la compatibilité du navigateur IE, utilisez des outils tels que AutoPrefixer pour ajouter automatiquement les préfixes du navigateur. Optimiser la taille de l'image, le format et l'ordre de chargement pour améliorer les performances de la page.

L'interface de chargement de la carte PS peut être causée par le logiciel lui-même (corruption de fichiers ou conflit de plug-in), l'environnement système (corruption du pilote ou des fichiers système en raison), ou matériel (corruption du disque dur ou défaillance du bâton de mémoire). Vérifiez d'abord si les ressources informatiques sont suffisantes, fermez le programme d'arrière-plan et publiez la mémoire et les ressources CPU. Correction de l'installation de PS ou vérifiez les problèmes de compatibilité pour les plug-ins. Mettre à jour ou tomber la version PS. Vérifiez le pilote de la carte graphique et mettez-le à jour et exécutez la vérification du fichier système. Si vous résumez les problèmes ci-dessus, vous pouvez essayer la détection du disque dur et les tests de mémoire.

La taille d'une liste d'amorçage dépend de la taille du conteneur qui contient la liste, pas de la liste elle-même. L'utilisation du système de grille de bootstrap ou de Flexbox peut contrôler la taille du conteneur, redimentant ainsi indirectement les éléments de la liste.

Les listes imbriquées dans Bootstrap nécessitent l'utilisation du système de grille de bootstrap pour contrôler le style. Tout d'abord, utilisez la couche extérieure & lt; ul & gt; et & lt; li & gt; Pour créer une liste, alors enveloppez la liste des calques intérieure dans & lt; div class = & quot; row & gt; et ajouter & lt; div class = & quot; col-md-6 & quot; & gt; à la liste des calques intérieure pour spécifier que la liste des calques intérieure occupe la moitié de la largeur d'une ligne. De cette façon, la liste intérieure peut avoir la bonne
