L'Université Tsinghua et Zhipu AI open source GLM-4 : lancent une nouvelle révolution dans le traitement du langage naturel-IA-php.cn

Table des matières

Maison

L'Université Tsinghua et Zhipu AI open source GLM-4 : lancent une nouvelle révolution dans le traitement du langage naturel

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 12, 2024 pm 08:38 PM

ai 代码 glm-4

Depuis le lancement du ChatGLM-6B le 14 mars 2023, les modèles de la série GLM ont reçu une large attention et une grande reconnaissance. Surtout après que ChatGLM3-6B soit open source, les développeurs sont pleins d'attentes pour le modèle de quatrième génération lancé par Zhipu AI. Cette attente a finalement été pleinement satisfaite avec la sortie du GLM-4-9B.

La naissance du GLM-4-9B

Afin de donner aux petits modèles (10B et moins) des capacités plus puissantes, l'équipe technique GLM a lancé ce nouveau modèle open source de la série GLM de quatrième génération après près de six mois d'exploration :GLM-4-9B. Ce modèle compresse considérablement la taille du modèle tout en garantissant la précision, et offre une vitesse d'inférence plus rapide et une efficacité plus élevée. L'exploration de l'équipe technique de GLM n'a pas de fin, et nous continuerons à travailler dur pour lancer un open source plus compétitif

technologie de pré-formation innovante

Au cours du processus de pré-formation, nous avons introduit un grand modèle de langage pour le filtrage des données, et a finalement obtenu 10T de données multilingues de haute qualité. Cette quantité de données est plus de trois fois supérieure à celle du modèle ChatGLM3-6B. De plus, nous utilisons la technologie FP8 pour un pré-entraînement efficace, qui améliore l'efficacité de l'entraînement de 3,5 fois par rapport au modèle de troisième génération. Compte tenu des besoins de stockage de l'utilisateur, la taille des paramètres du GLM-4-9B a été augmentée de 6B à 9B. En fin de compte, nous avons multiplié par 5 le calcul de pré-entraînement pour maximiser les capacités de performances dans des conditions de stockage limitées.

Excellente démonstration de performances

GLM-4-9B est un outil de mise à niveau technologique complet avec des performances de raisonnement plus puissantes, de meilleures capacités de traitement du contexte, une prise en charge multilingue, un traitement multimodal et un ensemble complet d'outils Tous les appels d'outils et d'autres avantages. Ces mises à niveau offrent aux utilisateurs un support technique plus stable, plus fiable et plus précis, et améliorent l'efficacité et la qualité du travail des utilisateurs.

La série GLM-4-9B comprend plusieurs versions :

Version de base : GLM-4-9B (8K)
Version conversation : GLM-4-9B-Chat (128K)
Version contextuelle extra longue : GLM-4-9B-Chat-1M (1M)
Version multimodale : GLM-4V-9B-Chat (8K)

Les puissantes capacités du GLM-4-9B

Capacités de base

Basé Grâce à une solide pré-formation, la maîtrise complète du chinois et de l'anglais du GLM-4-9B s'est améliorée de 40 % par rapport à ChatGLM3-6B. En particulier, des améliorations significatives ont été réalisées dans la capacité d'alignement chinoise AlignBench, la capacité de conformité des instructions IFeval et la capacité de traitement du code d'ingénierie Natural Code Bench. Même en comparant le modèle Llama 3 8B avec plus de volume d'entraînement, le GLM-4-9B n'est pas du tout inférieur et est en tête en termes de performances en anglais. Dans le domaine des matières chinoises, le GLM-4-9B s'est amélioré jusqu'à 50 % [Performance". Grille d'évaluation].

Capacité de traitement de texte long

清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命 Images

La longueur du contexte du modèle GLM-4-9B+ a été étendue de 128 000 à 1 million de jetons, ce qui signifie qu'il peut gérer la saisie jusqu'à 2 millions de mots à la fois. en même temps, ce qui équivaut à deux livres de « Dream of Red Mansions » » ou à la longueur de 125 articles académiques. Le modèle GLM-4-9B-Chat-1M a démontré avec succès son excellente capacité à traiter de manière non destructive la saisie de texte long dans l'expérience « une aiguille dans la botte de foin » [illustration d'une expérience de texte long].

Voici deux cas vidéo de démonstration montrant les capacités de traitement de texte long :

Modèle GLM-4-9B-Chat : Saisissez 5 fichiers PDF d'une longueur totale d'environ 128 Ko et rédigez un article sur Inviter pour un rapport de recherche détaillé sur le développement des grands modèles en Chine. Le modèle peut générer rapidement des rapports de recherche de haute qualité (la vidéo n'est pas accélérée).
Modèle GLM-4-9B-Chat-1M : Saisissez environ 900 000 mots dans la collection complète de « Le problème à trois corps » et demandez au modèle d'écrire un plan de suite pour le roman. Le modèle est raisonnablement planifié et un cadre de suite est donné (la vidéo est accélérée 10 fois).

Support multilingue

GLM-4-9B+ prend en charge jusqu'à 26 langues, dont le chinois, l'anglais, le russe, etc. Nous avons étendu la taille du vocabulaire du tokenizer de 65 Ko à 150 Ko, améliorant ainsi l'efficacité du codage de 30 %. Dans les tâches de compréhension et de génération multilingues, GLM-4-9B-Chat surpasse Llama-3-8B-Instruct [Tableau de comparaison des performances multilingues].

Capacité d'appel de fonction

La capacité d'appel de fonction du GLM-4-9B a augmenté de 40 % par rapport à la génération précédente. Sur le classement des appels de fonction de Berkeley, sa capacité d'appel de fonction est comparable à celle du GPT-4 [Performance des appels de fonction". Tableau de comparaison].

Appel d'outils complets pour tous les outils

La fonctionnalité "Tous les outils" signifie que le modèle peut comprendre et utiliser divers outils externes (tels que l'exécution de code, la navigation sur le réseau, le dessin, etc.) pour l'aider à accomplir les tâches. Lors du Zhipu DevDay du 16 janvier, le modèle GLM-4 a été entièrement mis à niveau avec les fonctionnalités All Tools, qui peuvent appeler intelligemment les navigateurs Web, les interpréteurs de code, CogView et d'autres outils pour répondre à des requêtes complexes [icône de tâche Tous les outils].

Traitement multimodal

GLM-4V-9B, un modèle multimodal open source basé sur le GLM-4, est capable de traiter des entrées haute résolution, mélangeant directement des données visuelles et textuelles pour la formation, démontrant remarquable L'effet de traitement multimodal est équivalent aux performances du GPT-4V. Il fonctionne très bien dans l'identification et le traitement de tâches multimodales complexes [Diagramme d'exemple d'application multimodale].

清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命 Pictures

Future Outlook

GLM-4-9B a démontré ses puissantes performances dans une variété de tâches et constitue une percée dans le domaine du traitement du langage naturel. Qu'il s'agisse de recherche universitaire ou d'applications industrielles, le GLM-4-9B sera votre meilleur choix.

Nous vous invitons sincèrement à rejoindre les rangs des utilisateurs de GLM-4 et à explorer les possibilités offertes par cet excellent modèle :

Référentiel GitHub
Page du modèle Hugging Face
Magic Community

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

4 Il y a quelques semaines By DDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semaines By DDD

Nordhold: Système de fusion, expliqué

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Java

1673

Tutoriel CakePHP

1429

Tutoriel Laravel

1333

Tutoriel PHP

1278

Tutoriel C#

1257

Afficher plus

Related knowledge

Classement d'échange quantitatif 2025 Top 10 des recommandations pour les applications de trading quantitatif de la monnaie numérique Apr 30, 2025 pm 07:24 PM

Les outils de quantification intégrés de l'échange comprennent: 1. Binance: fournit un module quantitatif à terme Binance Futures, des frais de manutention faible et prend en charge les transactions assistées par l'IA. 2. OKX (OUYI): prend en charge la gestion multi-comptes et le routage des ordres intelligents, et fournit un contrôle des risques au niveau institutionnel. Les plates-formes de stratégie quantitative indépendantes comprennent: 3. 3Commas: générateur de stratégie de glisser-déposer, adapté à l'arbitrage de la couverture multiplateforme. 4. Quadancy: Bibliothèque de stratégie d'algorithme de niveau professionnel, soutenant les seuils de risque personnalisés. 5. Pionex: stratégie prédéfinie intégrée, frais de transaction bas. Les outils de domaine vertical incluent: 6. CryptoPper: plate-forme quantitative basée sur le cloud, prenant en charge 150 indicateurs techniques. 7. Bitsgap:

Easeprotocol.com implémente directement la norme du message ISO 20022 en tant que contrat intelligent blockchain Apr 30, 2025 pm 05:06 PM

Ce développement révolutionnaire permettra aux institutions financières de tirer parti de la norme ISO20022 globalement reconnue pour automatiser les processus bancaires à travers différents écosystèmes de blockchain. Le protocole d'assistance est une plate-forme de blockchain au niveau de l'entreprise conçue pour promouvoir une adoption généralisée grâce à des méthodes faciles à utiliser. Il a annoncé aujourd'hui qu'il avait réussi à intégrer la norme de messagerie ISO20022 et l'a incorporé directement dans les contrats intelligents de la blockchain. Cette évolution permettra aux institutions financières d'automatiser facilement les processus bancaires dans différents écosystèmes de blockchain en utilisant la norme ISO20022 reconnue globalement, qui remplace le système de messagerie rapide. Ces fonctionnalités seront bientôt essayées sur "Easetestnet". Easeprotocolarchitecteddou

Y a-t-il un avenir pour les applications de monnaie numérique? Apple Mobile Digital Currency Trading Platform Téléchargez Top10 Apr 30, 2025 pm 07:00 PM

Les perspectives des applications de devises numériques sont larges, qui se reflètent spécifiquement dans: 1. Les mises à niveau des fonctions axées sur l'innovation technologique, l'amélioration de l'expérience utilisateur grâce à l'intégration des applications Defi et NFT et AI et Big Data; 2. Tendances de conformité réglementaire, améliorations du cadre mondial et exigences plus strictes pour la LMA et le KYC; 3. Diversification des fonctions et expansion des services, intégration des prêts, de la gestion financière et d'autres services et de l'optimisation de l'expérience utilisateur; 4. base d'utilisateurs et expansion globale, et l'échelle utilisateur devrait dépasser 1 milliard en 2025.

Échec de l'échange de crypto FTX prend une action en justice contre les émetteurs spécifiques dans la dernière tentative Apr 30, 2025 pm 05:24 PM

Dans sa dernière tentative, le Résolved Crypto Exchange FTX a intenté une action en justice pour recouvrer les dettes et rembourser les clients. Dans les derniers efforts visant à recouvrer les dettes et à rembourser les clients, le Résolved Crypto Exchange FTX a déposé une action en justice contre des émetteurs spécifiques. FTX Trading et FTX Recovery Trust ont déposé des poursuites contre certains émetteurs de jetons qui n'ont pas respecté leur accord pour remettre des pièces convenues à la bourse. Plus précisément, l'équipe de restructuration a poursuivi NFTStars Limited et Oroosemi Inc. lundi sur les problèmes de conformité. FTX poursuit l'émetteur de jetons pour récupérer les pièces expirées. FTX était autrefois l'une des plateformes de trading de crypto-monnaie les plus remarquables aux États-Unis. La banque a rapporté en novembre 2022 que son fondateur Sam

Quels sont les trois géants du cercle des devises? Top 10 des applications d'échange principale de devises virtuelles recommandées Apr 30, 2025 pm 06:27 PM

Dans le cercle des devises, les soi-disant Big Three se réfèrent généralement aux trois crypto-monnaies les plus influentes et les plus utilisées. Ces crypto-monnaies ont un rôle important sur le marché et ont bien performé en termes de volume de transactions et de capitalisation boursière. Dans le même temps, l'application grand public de change virtuel est également un outil important pour les investisseurs et les commerçants pour effectuer le trading des crypto-monnaies. Cet article introduira en détail les trois géants du cercle des devises et les dix principales applications d'échange de devises virtuelles traditionnelles recommandées.

Les 10 meilleures plateformes de crypto-monnaie au monde qui prennent en charge les transactions multi-chaînes sont publiées avec autorité en 2025 May 08, 2025 pm 07:15 PM

Selon les dernières évaluations et les tendances de l'industrie des institutions faisant autorité en 2025, les dix principales plateformes de crypto-monnaie au monde sont les dix principales plateformes de crypto-monnaie qui prennent en charge les transactions multi-chaînes, combinant le volume des transactions, l'innovation technologique, la conformité et la réputation de l'utilisateur Analyse complète:

IA et compositeur: améliorer la qualité et le développement du code May 09, 2025 am 12:20 AM

Dans le compositeur, l'IA améliore principalement l'efficacité du développement et la qualité du code grâce à la recommandation de dépendance, à la résolution des conflits de dépendance et à l'amélioration de la qualité du code. 1. L'IA peut recommander des forfaits de dépendance appropriés en fonction des besoins du projet. 2. L'IA fournit des solutions intelligentes pour faire face aux conflits de dépendance. 3. L'IA examine le code et fournit des suggestions d'optimisation pour améliorer la qualité du code. Grâce à ces fonctions, les développeurs peuvent se concentrer davantage sur la mise en œuvre de la logique commerciale.

Top 10 des applications de trading de devises virtuelles numériques en 2025 Résumé des 10 principales applications de change de monnaie numérique May 08, 2025 pm 05:24 PM

Classement des dix principales applications de trading de devises virtuelles numériques en 2025: 1. Binance: diriger le monde, fournir des transactions efficaces et une variété de produits financiers. 2. OKX: Il est innovant et diversifié, soutenant une variété de types de transactions. 3. Huobi: stable et fiable, avec service de haute qualité. 4. Coinbase: Soyez amical pour les débutants et une interface simple. 5. Kraken: le premier choix pour les commerçants professionnels, avec des outils puissants. 6. Bitfinex: trading efficace, paires de trading riches. 7. Bittrex: conformité à la sécurité, coopération réglementaire.

See all articles