


Avec des centaines de milliards de paramètres, Alibaba Cloud Tongyi Qianwen a évolué vers 2.0 : des performances dépassant GPT-3.5 et s'accélèrent pour rattraper GPT-4.
Alibaba Cloud a officiellement publié Tongyi Qianwen 2.0, un grand modèle avec des centaines de milliards de paramètres, le 31 octobre. Selon 10 résultats d'évaluation faisant autorité, les performances globales de Tongyi Qianwen 2.0 dépassent GPT-3.5 et rattrapent rapidement GPT-4. Le même jour, l'APP Tongyi Qianwen a été lancée sur les principaux marchés d'applications mobiles. Tout le monde peut directement découvrir les capacités du dernier modèle via l'APP
Au cours des 6 derniers mois, Tongyi Qianwen 2.0 a fait un énorme bond en avant en termes de performances par rapport à l'application Tongyi Qianwen. 4 Version 1.0 publiée en mars, Tongyi Qianwen 2.0 a considérablement amélioré ses capacités en matière de compréhension des commandes complexes, de création littéraire, de mathématiques générales, de mémoire des connaissances et de résistance aux hallucinations. À l'heure actuelle, les performances globales de Tongyi Qianwen ont dépassé GPT-3.5, accélérant pour rattraper GPT-4.
Dans 10 ensembles d'évaluation de référence grand public tels que MMLU, C-Eval, GSM8K, HumanEval et MATH, il a réussi Le score global de Yiqianwen 2.0 surpasse celui de Meta Llama-2-70B. Par rapport au Chat-3.5 d'OpenAI, il compte neuf victoires et une défaite. Par rapport à GPT-4, il compte quatre victoires et six défaites. avec GPT-4 s'est encore rétréci
La capacité à comprendre le chinois et l'anglais est la compétence de base des grands modèles linguistiques. En termes de tâches en anglais, Tongyi Qianwen 2.0 a obtenu un score de 82,5 au benchmark MMLU, juste derrière GPT-4. En augmentant considérablement le nombre de paramètres, Tongyi Qianwen 2.0 peut mieux comprendre et traiter les structures et concepts linguistiques complexes du chinois. , Tongyi Qianwen 2.0 a obtenu le score le plus élevé au benchmark C-Eval avec un net avantage, car le modèle a appris davantage de corpus chinois pendant la formation, renforçant ainsi ses capacités de compréhension et d'expression du chinois.
Dans des domaines tels que le raisonnement mathématique et la compréhension du code, Tongyi Qianwen 2.0 a fait des progrès significatifs. Dans le test de référence de raisonnement GSM8K, Tongyi Qianwen s'est classé deuxième, démontrant de solides capacités de calcul et de raisonnement logique ; dans le test HumanEval, le score de Tongyi Qianwen a suivi de près GPT-4 et GPT-3.5, qui mesurent principalement la capacité du modèle à grande échelle. Comprendre et exécuter des fragments de code constitue la base des grands modèles à utiliser dans des scénarios tels que l'assistance à la programmation et la réparation automatique du code.
Tongyi Qianwen est plus mature et plus facile à utiliser. Tongyi Qianwen 2.0 a apporté des optimisations techniques en termes de conformité aux instructions, d'utilisation des outils, de création raffinée, etc., afin de pouvoir mieux l'intégrer dans les scénarios d'application en aval. Le site officiel de Tongyi Large Model a lancé des fonctions multimodales et plug-in, prenant en charge des tâches segmentées telles que la saisie d'images et l'analyse de documents.
Dans le même temps, huit grands groupes de modèles industriels basés sur la formation des grands modèles Tongyi ont été lancés : Tongyi Lingma - assistant de codage intelligent, Tongyi Zhiwen - assistant de lecture IA, Tongyi Listening - assistant IA pour le travail et les études, Tongyi Stardust -. plate-forme de création de personnages personnalisée, Tongyi Midianjin - assistant de recherche en investissement intelligent, Tongyi Xiaomi - service client intelligent, Tongyi Renxin - assistant de santé personnel exclusif, Tongyi Farui - consultant juridique en IA. Les 8 principaux modèles industriels sont conçus pour les scénarios verticaux les plus populaires et sont spécialement formés à l'aide de données de domaine. Les utilisateurs peuvent directement découvrir les fonctions de modèle sur le site Web officiel, et les développeurs peuvent intégrer les capacités de modèle dans leurs propres applications et services de modèle volumineux via l'intégration de pages Web, les appels API/SDK, etc.
Depuis octobre, Alibaba Cloud a mené une coopération approfondie avec des partenaires de premier plan dans plus de 60 secteurs , faisant la promotion du général Qianwen dans Applications pratiques dans les domaines du bureau, du tourisme culturel, de l'énergie électrique, des affaires gouvernementales, de l'assurance médicale, des transports, de la fabrication, de la finance, du développement de logiciels et d'autres domaines
Zhou Jingren a déclaré qu'Alibaba Cloud prévoyait d'ouvrir la version 72B de Tongyi Qianwen dans un futur proche. Auparavant, Alibaba Cloud avait ouvert les versions 7B et 14B du modèle, et les téléchargements cumulés de ces modèles ont dépassé le million. Alibaba Cloud continuera d'aider les développeurs de divers secteurs à utiliser le modèle open source Tongyi Qianwen pour innover en matière de modèles et d'applications
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

La diffusion permet non seulement de mieux imiter, mais aussi de « créer ». Le modèle de diffusion (DiffusionModel) est un modèle de génération d'images. Par rapport aux algorithmes bien connus tels que GAN et VAE dans le domaine de l’IA, le modèle de diffusion adopte une approche différente. Son idée principale est un processus consistant à ajouter d’abord du bruit à l’image, puis à la débruiter progressivement. Comment débruiter et restaurer l’image originale est la partie centrale de l’algorithme. L'algorithme final est capable de générer une image à partir d'une image bruitée aléatoirement. Ces dernières années, la croissance phénoménale de l’IA générative a permis de nombreuses applications passionnantes dans la génération de texte en image, la génération de vidéos, et bien plus encore. Le principe de base de ces outils génératifs est le concept de diffusion, un mécanisme d'échantillonnage spécial qui surmonte les limites des méthodes précédentes.

Kimi : En une seule phrase, un PPT est prêt en seulement dix secondes. PPT est tellement ennuyeux ! Pour tenir une réunion, vous devez avoir un PPT ; pour rédiger un rapport hebdomadaire, vous devez avoir un PPT ; pour solliciter des investissements, vous devez présenter un PPT ; même pour accuser quelqu'un de tricherie, vous devez envoyer un PPT ; L'université ressemble plus à une spécialisation PPT. Vous regardez le PPT en classe et faites le PPT après les cours. Peut-être que lorsque Dennis Austin a inventé le PPT il y a 37 ans, il ne s'attendait pas à ce qu'un jour le PPT devienne aussi répandu. Parler de notre dure expérience de création de PPT nous fait monter les larmes aux yeux. "Il m'a fallu trois mois pour réaliser un PPT de plus de 20 pages, et je l'ai révisé des dizaines de fois. J'avais envie de vomir quand j'ai vu le PPT." "À mon apogée, je faisais cinq PPT par jour, et même ma respiration." était PPT." Si vous avez une réunion impromptue, vous devriez le faire

Tôt le matin du 20 juin, heure de Pékin, CVPR2024, la plus grande conférence internationale sur la vision par ordinateur qui s'est tenue à Seattle, a officiellement annoncé le meilleur article et d'autres récompenses. Cette année, un total de 10 articles ont remporté des prix, dont 2 meilleurs articles et 2 meilleurs articles étudiants. De plus, il y a eu 2 nominations pour les meilleurs articles et 4 nominations pour les meilleurs articles étudiants. La conférence la plus importante dans le domaine de la vision par ordinateur (CV) est la CVPR, qui attire chaque année un grand nombre d'instituts de recherche et d'universités. Selon les statistiques, un total de 11 532 articles ont été soumis cette année, dont 2 719 ont été acceptés, avec un taux d'acceptation de 23,6 %. Selon l'analyse statistique des données CVPR2024 du Georgia Institute of Technology, du point de vue des sujets de recherche, le plus grand nombre d'articles est la synthèse et la génération d'images et de vidéos (Imageandvideosyn

En tant que langage de programmation largement utilisé, le langage C est l'un des langages de base qui doivent être appris pour ceux qui souhaitent se lancer dans la programmation informatique. Cependant, pour les débutants, l’apprentissage d’un nouveau langage de programmation peut s’avérer quelque peu difficile, notamment en raison du manque d’outils d’apprentissage et de matériel pédagogique pertinents. Dans cet article, je présenterai cinq logiciels de programmation pour aider les débutants à démarrer avec le langage C et vous aider à démarrer rapidement. Le premier logiciel de programmation était Code :: Blocks. Code::Blocks est un environnement de développement intégré (IDE) gratuit et open source pour

Nous savons que le LLM est formé sur des clusters informatiques à grande échelle utilisant des données massives. Ce site a présenté de nombreuses méthodes et technologies utilisées pour aider et améliorer le processus de formation LLM. Aujourd'hui, ce que nous souhaitons partager est un article qui approfondit la technologie sous-jacente et présente comment transformer un ensemble de « bare metals » sans même un système d'exploitation en un cluster informatique pour la formation LLM. Cet article provient d'Imbue, une startup d'IA qui s'efforce d'atteindre une intelligence générale en comprenant comment les machines pensent. Bien sûr, transformer un tas de « bare metal » sans système d'exploitation en un cluster informatique pour la formation LLM n'est pas un processus facile, plein d'exploration et d'essais et d'erreurs, mais Imbue a finalement réussi à former un LLM avec 70 milliards de paramètres et dans. le processus s'accumule

Démarrage rapide avec PyCharm Community Edition : Tutoriel d'installation détaillé Analyse complète Introduction : PyCharm est un puissant environnement de développement intégré (IDE) Python qui fournit un ensemble complet d'outils pour aider les développeurs à écrire du code Python plus efficacement. Cet article présentera en détail comment installer PyCharm Community Edition et fournira des exemples de code spécifiques pour aider les débutants à démarrer rapidement. Étape 1 : Téléchargez et installez PyCharm Community Edition Pour utiliser PyCharm, vous devez d'abord le télécharger depuis son site officiel

Titre : Une lecture incontournable pour les débutants en technique : Analyse des difficultés du langage C et de Python, nécessitant des exemples de code spécifiques. À l'ère numérique d'aujourd'hui, la technologie de programmation est devenue une capacité de plus en plus importante. Que vous souhaitiez travailler dans des domaines tels que le développement de logiciels, l'analyse de données, l'intelligence artificielle ou simplement apprendre la programmation par intérêt, choisir un langage de programmation adapté est la première étape. Parmi les nombreux langages de programmation, le langage C et Python sont deux langages de programmation largement utilisés, chacun ayant ses propres caractéristiques. Cet article analysera les niveaux de difficulté du langage C et Python

Rédacteur du Machine Power Report : Yang Wen La vague d’intelligence artificielle représentée par les grands modèles et l’AIGC a discrètement changé notre façon de vivre et de travailler, mais la plupart des gens ne savent toujours pas comment l’utiliser. C'est pourquoi nous avons lancé la rubrique « AI in Use » pour présenter en détail comment utiliser l'IA à travers des cas d'utilisation de l'intelligence artificielle intuitifs, intéressants et concis et stimuler la réflexion de chacun. Nous invitons également les lecteurs à soumettre des cas d'utilisation innovants et pratiques. Lien vidéo : https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ Récemment, le vlog de la vie d'une fille vivant seule est devenu populaire sur Xiaohongshu. Une animation de style illustration, associée à quelques mots de guérison, peut être facilement récupérée en quelques jours seulement.
