


Zhipu AI lance le grand modèle de base ChatGLM3 de troisième génération pour s'adapter à davantage de puces nationales
La nouvelle du 27 octobre 2023 est que Zhipu AI a lancé un nouveau modèle de base à grande base de troisième génération auto-développé ChatGLM3 et une série de produits associés lors de la China Computer Conference (CNCC). Cette version marque une avancée majeure pour Zhipu AI après le lancement des modèles de conversation de base de 100 milliards ChatGLM et ChatGLM2
ChatGLM3 est développé à l'aide d'une méthode originale de pré-formation améliorée en plusieurs étapes. Cette méthode peut rendre la formation plus complète. Selon les résultats de l'évaluation, dans 44 tests d'ensembles de données publiques en chinois et en anglais, ChatGLM3 s'est classé premier parmi les modèles nationaux de même taille. Zhang Peng, PDG de Zhipu AI, a présenté de nouveaux produits lors de la conférence de presse et a présenté les dernières fonctionnalités du produit en temps réel
Nouvelle mise à niveau technologique ChatGLM3 avec des performances supérieures et un coût inférieur
ChatGLM3 lancé par Zhipu AI est devenu plus puissant avec des données de formation plus riches et de meilleures solutions de formation. Par rapport à ChatGLM2, MMLU a augmenté de 36 %, CEval a augmenté de 33 %, GSM8K a augmenté de 179 % et BBH a augmenté de 126 %
Dans le même temps, ChatGLM3 vise GPT-4V et a mis en œuvre des mises à niveau itératives de plusieurs nouvelles fonctions, notamment CogVLM avec des capacités de compréhension multimodale - sémantique de reconnaissance d'image, qui a atteint SOTA sur plus de 10 ensembles de données d'évaluation graphique standards internationaux ; code Le module amélioré Code Interpreter génère du code et l'exécute en fonction des besoins de l'utilisateur, accomplissant automatiquement des tâches complexes telles que l'analyse des données et le traitement des fichiers ; l'amélioration de la recherche sur le réseau L'amélioration de la recherche par accès WebGLM peut rechercher automatiquement des informations pertinentes sur Internet en fonction de questions et fournir références pertinentes lors de la réponse. Liens vers la littérature ou les articles. Les capacités sémantiques et logiques de ChatGLM3 ont été considérablement améliorées.
ChatGLM3 intègre également la technologie AgentTuning auto-développée, qui active les capacités de l'agent modèle, notamment en termes de planification et d'exécution intelligentes, qui est 1000 % améliorée par rapport à ChatGLM2 et permet également aux grands modèles nationaux de prendre en charge nativement les appels d'outils et l'exécution de code ; , jeux, opérations de base de données, recherche et raisonnement de graphiques de connaissances, systèmes d'exploitation et autres scénarios complexes.
De plus, ChatGLM3 lance cette fois les modèles de test final ChatGLM3-1.5B et ChatGLM3-3B qui peuvent être déployés sur les téléphones mobiles. Ils prennent en charge une variété de téléphones mobiles et de plates-formes montées sur véhicule, notamment Vivo, Xiaomi et Samsung, et même. prend en charge l'inférence des puces CPU sur les plates-formes mobiles. La vitesse peut atteindre 20 jetons/s. En termes de précision, les performances des modèles 1,5B et 3B sont proches de celles du modèle ChatGLM2-6B sur les benchmarks publics.
Basé sur la dernière technologie efficace d'inférence dynamique et d'optimisation de la mémoire, le cadre d'inférence actuel de ChatGLM3 dans les mêmes conditions matérielles et de modèle, comparé à la meilleure implémentation open source actuelle, y compris vLLM lancé par l'Université de Berkeley et la dernière version de Hugging Face à TGI, inférence La vitesse est augmentée de 2 à 3 fois et le coût d'inférence est doublé. Il n'est que de 0,5 point pour mille jetons et le coût est le plus bas.
Ce contenu est à titre indicatif uniquement et ne constitue aucun conseil en investissement. Les lecteurs doivent faire preuve de jugement lorsqu’ils utilisent ces informations et assumer la responsabilité de leurs propres décisions. Ce site Web n'est pas responsable des pertes causées par l'utilisation de ce contenu
Ce compte ne fait aucune déclaration ou garantie quant à la disponibilité, l'exactitude, l'actualité, la validité ou l'exhaustivité de toute information publiée, et décline par la présente toute responsabilité ou toute conséquence pouvant découler de l'information. Après réécriture : ce compte ne fait aucune déclaration ni garantie quant à la disponibilité, l'exactitude, l'actualité, la validité ou l'exhaustivité de toute information publiée, et n'assume aucune responsabilité ni conséquence dans cette déclaration
2. Ce compte est non commercial et à but non lucratif. Le contenu reproduit ne signifie pas que vous êtes d'accord avec ses opinions et que vous êtes responsable de son authenticité, et n'est pas non plus destiné à constituer une quelconque autre orientation. Ce site Web n'est pas responsable de toute responsabilité directe ou indirecte pour toute inexactitude ou erreur dans toute information reproduite ou publiée.
3. Les informations, documents, textes, images, etc. utilisés dans cet article proviennent d'Internet et tout le contenu reproduit a été marqué avec la source. Si vous trouvez une œuvre qui porte atteinte à vos droits de propriété intellectuelle ou à vos droits légaux personnels, veuillez nous contacter et nous la modifierons ou la supprimerons à temps
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

L'article compare les meilleurs chatbots d'IA comme Chatgpt, Gemini et Claude, en se concentrant sur leurs fonctionnalités uniques, leurs options de personnalisation et leurs performances dans le traitement et la fiabilité du langage naturel.

META'S LLAMA 3.2: un bond en avant dans l'IA multimodal et mobile Meta a récemment dévoilé Llama 3.2, une progression importante de l'IA avec de puissantes capacités de vision et des modèles de texte légers optimisés pour les appareils mobiles. S'appuyer sur le succès o

L'article traite des meilleurs assistants d'écriture d'IA comme Grammarly, Jasper, Copy.ai, WireSonic et Rytr, en se concentrant sur leurs fonctionnalités uniques pour la création de contenu. Il soutient que Jasper excelle dans l'optimisation du référencement, tandis que les outils d'IA aident à maintenir le ton

Dans le monde actuel axé sur les données, l'indexation géospatiale efficace est cruciale pour les applications allant du covoiturage et de la logistique à la surveillance environnementale et à la réponse aux catastrophes. H3 d'Uber, une puissante crachat open-source
