


L'Université Tsinghua et Zhipu AI open source GLM-4 : lancent une nouvelle révolution dans le traitement du langage naturel
Depuis le lancement du ChatGLM-6B le 14 mars 2023, les modèles de la série GLM ont reçu une large attention et une grande reconnaissance. Surtout après que ChatGLM3-6B soit open source, les développeurs sont pleins d'attentes pour le modèle de quatrième génération lancé par Zhipu AI. Cette attente a finalement été pleinement satisfaite avec la sortie du GLM-4-9B.
La naissance du GLM-4-9B
Afin de donner aux petits modèles (10B et moins) des capacités plus puissantes, l'équipe technique GLM a lancé ce nouveau modèle open source de la série GLM de quatrième génération après près de six mois d'exploration :GLM-4-9B. Ce modèle compresse considérablement la taille du modèle tout en garantissant la précision, et offre une vitesse d'inférence plus rapide et une efficacité plus élevée. L'exploration de l'équipe technique de GLM n'a pas de fin, et nous continuerons à travailler dur pour lancer un open source plus compétitif
technologie de pré-formation innovante
Au cours du processus de pré-formation, nous avons introduit un grand modèle de langage pour le filtrage des données, et a finalement obtenu 10T de données multilingues de haute qualité. Cette quantité de données est plus de trois fois supérieure à celle du modèle ChatGLM3-6B. De plus, nous utilisons la technologie FP8 pour un pré-entraînement efficace, qui améliore l'efficacité de l'entraînement de 3,5 fois par rapport au modèle de troisième génération. Compte tenu des besoins de stockage de l'utilisateur, la taille des paramètres du GLM-4-9B a été augmentée de 6B à 9B. En fin de compte, nous avons multiplié par 5 le calcul de pré-entraînement pour maximiser les capacités de performances dans des conditions de stockage limitées.
Excellente démonstration de performances
GLM-4-9B est un outil de mise à niveau technologique complet avec des performances de raisonnement plus puissantes, de meilleures capacités de traitement du contexte, une prise en charge multilingue, un traitement multimodal et un ensemble complet d'outils Tous les appels d'outils et d'autres avantages. Ces mises à niveau offrent aux utilisateurs un support technique plus stable, plus fiable et plus précis, et améliorent l'efficacité et la qualité du travail des utilisateurs.
La série GLM-4-9B comprend plusieurs versions :
- Version de base : GLM-4-9B (8K)
- Version conversation : GLM-4-9B-Chat (128K)
- Version contextuelle extra longue : GLM-4-9B-Chat-1M (1M)
- Version multimodale : GLM-4V-9B-Chat (8K)
Les puissantes capacités du GLM-4-9B
Capacités de base
Basé Grâce à une solide pré-formation, la maîtrise complète du chinois et de l'anglais du GLM-4-9B s'est améliorée de 40 % par rapport à ChatGLM3-6B. En particulier, des améliorations significatives ont été réalisées dans la capacité d'alignement chinoise AlignBench, la capacité de conformité des instructions IFeval et la capacité de traitement du code d'ingénierie Natural Code Bench. Même en comparant le modèle Llama 3 8B avec plus de volume d'entraînement, le GLM-4-9B n'est pas du tout inférieur et est en tête en termes de performances en anglais. Dans le domaine des matières chinoises, le GLM-4-9B s'est amélioré jusqu'à 50 % [Performance". Grille d'évaluation].
Capacité de traitement de texte long
Images
La longueur du contexte du modèle GLM-4-9B+ a été étendue de 128 000 à 1 million de jetons, ce qui signifie qu'il peut gérer la saisie jusqu'à 2 millions de mots à la fois. en même temps, ce qui équivaut à deux livres de « Dream of Red Mansions » » ou à la longueur de 125 articles académiques. Le modèle GLM-4-9B-Chat-1M a démontré avec succès son excellente capacité à traiter de manière non destructive la saisie de texte long dans l'expérience « une aiguille dans la botte de foin » [illustration d'une expérience de texte long].
Voici deux cas vidéo de démonstration montrant les capacités de traitement de texte long :
- Modèle GLM-4-9B-Chat : Saisissez 5 fichiers PDF d'une longueur totale d'environ 128 Ko et rédigez un article sur Inviter pour un rapport de recherche détaillé sur le développement des grands modèles en Chine. Le modèle peut générer rapidement des rapports de recherche de haute qualité (la vidéo n'est pas accélérée).
- Modèle GLM-4-9B-Chat-1M : Saisissez environ 900 000 mots dans la collection complète de « Le problème à trois corps » et demandez au modèle d'écrire un plan de suite pour le roman. Le modèle est raisonnablement planifié et un cadre de suite est donné (la vidéo est accélérée 10 fois).
Support multilingue
GLM-4-9B+ prend en charge jusqu'à 26 langues, dont le chinois, l'anglais, le russe, etc. Nous avons étendu la taille du vocabulaire du tokenizer de 65 Ko à 150 Ko, améliorant ainsi l'efficacité du codage de 30 %. Dans les tâches de compréhension et de génération multilingues, GLM-4-9B-Chat surpasse Llama-3-8B-Instruct [Tableau de comparaison des performances multilingues].
Capacité d'appel de fonction
La capacité d'appel de fonction du GLM-4-9B a augmenté de 40 % par rapport à la génération précédente. Sur le classement des appels de fonction de Berkeley, sa capacité d'appel de fonction est comparable à celle du GPT-4 [Performance des appels de fonction". Tableau de comparaison].
Appel d'outils complets pour tous les outils
La fonctionnalité "Tous les outils" signifie que le modèle peut comprendre et utiliser divers outils externes (tels que l'exécution de code, la navigation sur le réseau, le dessin, etc.) pour l'aider à accomplir les tâches. Lors du Zhipu DevDay du 16 janvier, le modèle GLM-4 a été entièrement mis à niveau avec les fonctionnalités All Tools, qui peuvent appeler intelligemment les navigateurs Web, les interpréteurs de code, CogView et d'autres outils pour répondre à des requêtes complexes [icône de tâche Tous les outils].
Traitement multimodal
GLM-4V-9B, un modèle multimodal open source basé sur le GLM-4, est capable de traiter des entrées haute résolution, mélangeant directement des données visuelles et textuelles pour la formation, démontrant remarquable L'effet de traitement multimodal est équivalent aux performances du GPT-4V. Il fonctionne très bien dans l'identification et le traitement de tâches multimodales complexes [Diagramme d'exemple d'application multimodale].
Pictures
Future Outlook
GLM-4-9B a démontré ses puissantes performances dans une variété de tâches et constitue une percée dans le domaine du traitement du langage naturel. Qu'il s'agisse de recherche universitaire ou d'applications industrielles, le GLM-4-9B sera votre meilleur choix.
Nous vous invitons sincèrement à rejoindre les rangs des utilisateurs de GLM-4 et à explorer les possibilités offertes par cet excellent modèle :
- Référentiel GitHub
- Page du modèle Hugging Face
- Magic Community
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Les outils de quantification intégrés de l'échange comprennent: 1. Binance: fournit un module quantitatif à terme Binance Futures, des frais de manutention faible et prend en charge les transactions assistées par l'IA. 2. OKX (OUYI): prend en charge la gestion multi-comptes et le routage des ordres intelligents, et fournit un contrôle des risques au niveau institutionnel. Les plates-formes de stratégie quantitative indépendantes comprennent: 3. 3Commas: générateur de stratégie de glisser-déposer, adapté à l'arbitrage de la couverture multiplateforme. 4. Quadancy: Bibliothèque de stratégie d'algorithme de niveau professionnel, soutenant les seuils de risque personnalisés. 5. Pionex: stratégie prédéfinie intégrée, frais de transaction bas. Les outils de domaine vertical incluent: 6. CryptoPper: plate-forme quantitative basée sur le cloud, prenant en charge 150 indicateurs techniques. 7. Bitsgap:

Ce développement révolutionnaire permettra aux institutions financières de tirer parti de la norme ISO20022 globalement reconnue pour automatiser les processus bancaires à travers différents écosystèmes de blockchain. Le protocole d'assistance est une plate-forme de blockchain au niveau de l'entreprise conçue pour promouvoir une adoption généralisée grâce à des méthodes faciles à utiliser. Il a annoncé aujourd'hui qu'il avait réussi à intégrer la norme de messagerie ISO20022 et l'a incorporé directement dans les contrats intelligents de la blockchain. Cette évolution permettra aux institutions financières d'automatiser facilement les processus bancaires dans différents écosystèmes de blockchain en utilisant la norme ISO20022 reconnue globalement, qui remplace le système de messagerie rapide. Ces fonctionnalités seront bientôt essayées sur "Easetestnet". Easeprotocolarchitecteddou

Les perspectives des applications de devises numériques sont larges, qui se reflètent spécifiquement dans: 1. Les mises à niveau des fonctions axées sur l'innovation technologique, l'amélioration de l'expérience utilisateur grâce à l'intégration des applications Defi et NFT et AI et Big Data; 2. Tendances de conformité réglementaire, améliorations du cadre mondial et exigences plus strictes pour la LMA et le KYC; 3. Diversification des fonctions et expansion des services, intégration des prêts, de la gestion financière et d'autres services et de l'optimisation de l'expérience utilisateur; 4. base d'utilisateurs et expansion globale, et l'échelle utilisateur devrait dépasser 1 milliard en 2025.

Dans sa dernière tentative, le Résolved Crypto Exchange FTX a intenté une action en justice pour recouvrer les dettes et rembourser les clients. Dans les derniers efforts visant à recouvrer les dettes et à rembourser les clients, le Résolved Crypto Exchange FTX a déposé une action en justice contre des émetteurs spécifiques. FTX Trading et FTX Recovery Trust ont déposé des poursuites contre certains émetteurs de jetons qui n'ont pas respecté leur accord pour remettre des pièces convenues à la bourse. Plus précisément, l'équipe de restructuration a poursuivi NFTStars Limited et Oroosemi Inc. lundi sur les problèmes de conformité. FTX poursuit l'émetteur de jetons pour récupérer les pièces expirées. FTX était autrefois l'une des plateformes de trading de crypto-monnaie les plus remarquables aux États-Unis. La banque a rapporté en novembre 2022 que son fondateur Sam

Dans le cercle des devises, les soi-disant Big Three se réfèrent généralement aux trois crypto-monnaies les plus influentes et les plus utilisées. Ces crypto-monnaies ont un rôle important sur le marché et ont bien performé en termes de volume de transactions et de capitalisation boursière. Dans le même temps, l'application grand public de change virtuel est également un outil important pour les investisseurs et les commerçants pour effectuer le trading des crypto-monnaies. Cet article introduira en détail les trois géants du cercle des devises et les dix principales applications d'échange de devises virtuelles traditionnelles recommandées.

Selon les dernières évaluations et les tendances de l'industrie des institutions faisant autorité en 2025, les dix principales plateformes de crypto-monnaie au monde sont les dix principales plateformes de crypto-monnaie qui prennent en charge les transactions multi-chaînes, combinant le volume des transactions, l'innovation technologique, la conformité et la réputation de l'utilisateur Analyse complète:

Dans le compositeur, l'IA améliore principalement l'efficacité du développement et la qualité du code grâce à la recommandation de dépendance, à la résolution des conflits de dépendance et à l'amélioration de la qualité du code. 1. L'IA peut recommander des forfaits de dépendance appropriés en fonction des besoins du projet. 2. L'IA fournit des solutions intelligentes pour faire face aux conflits de dépendance. 3. L'IA examine le code et fournit des suggestions d'optimisation pour améliorer la qualité du code. Grâce à ces fonctions, les développeurs peuvent se concentrer davantage sur la mise en œuvre de la logique commerciale.

Classement des dix principales applications de trading de devises virtuelles numériques en 2025: 1. Binance: diriger le monde, fournir des transactions efficaces et une variété de produits financiers. 2. OKX: Il est innovant et diversifié, soutenant une variété de types de transactions. 3. Huobi: stable et fiable, avec service de haute qualité. 4. Coinbase: Soyez amical pour les débutants et une interface simple. 5. Kraken: le premier choix pour les commerçants professionnels, avec des outils puissants. 6. Bitfinex: trading efficace, paires de trading riches. 7. Bittrex: conformité à la sécurité, coopération réglementaire.
