ChatGPT domestique est à nouveau open source ! L'effet a été considérablement amélioré et peut également être exécuté sur les téléphones mobiles.-IA-php.cn

Table des matières

01 Qu'est-ce que ChatYuan-large-v2 ?

02 Quelles sont les améliorations vers la v2 ?

Conclusion

Maison

Périphériques technologiques

ChatGPT domestique est à nouveau open source ! L'effet a été considérablement amélioré et peut également être exécuté sur les téléphones mobiles.

王林

Apr 04, 2023 am 11:30 AM

模型开源

Récemment, l'équipe Yuanyu Intelligence a ouvert un autre grand modèle de la série ChatYuan : ChatYuan-large-v2, qui prend en charge l'inférence sur une seule carte graphique grand public, un PC et même des téléphones mobiles.

Tout à l'heure, "Chinese ChatGPT" ChatYuan a publié une nouvelle version.

Le ChatYuan-large-v2 mis à jour prend non seulement en charge les langues bilingues chinois et anglais, mais prend également en charge une longueur totale d'entrée et de sortie allant jusqu'à 4k.

C'est également le résultat de la recherche de Yuanyu Intelligence en direction des grands modèles après les précédents modèles PromptCLUE-base, PromptCLUE-v1-5 et ChatYuan-large-v1.

ChatGPT domestique est à nouveau open source ! Leffet a été considérablement amélioré et peut également être exécuté sur les téléphones mobiles.

Adresse du projet Open source :

https://github.com/clue-ai/ChatYuan

Huggingface :

https://huggingface.co/ClueAI/ChatYuan-large-v2

Modelscope :

https://modelscope.cn/models/ClueAI/ChatYuan-large-v2/summary

01 Qu'est-ce que ChatYuan-large-v2 ?

ChatYuan-large-v2 est un grand modèle de langage conversationnel fonctionnel qui prend en charge le bilinguisme chinois et anglais. ChatYuan-large-v2 utilise la même solution technique que la version v1, en termes de réglage fin des instructions, d'apprentissage par renforcement des commentaires humains et. chaînes de pensée optimisées.

ChatYuan-large-v2 est un modèle représentatif de la série ChatYuan qui permet d'obtenir des effets de haute qualité avec une conception légère. Il peut obtenir les effets de base du modèle 10B de l'industrie avec seulement 0,7B de paramètres, réduisant considérablement les coûts d'inférence et améliorant l'efficacité d'utilisation. . Les utilisateurs peuvent effectuer des inférences sur des cartes graphiques grand public, des PC et même des téléphones mobiles (INT4 ne nécessite qu'un minimum de 400 Mo).

Dans le même temps, afin de mieux améliorer l'expérience utilisateur, l'équipe a encapsulé des outils. Chatyuan-large-v2 a été implémenté localement et peut être exécuté localement. Après téléchargement, la version h5 peut être utilisée directement localement pour le web. interaction avec les pages.

02 Quelles sont les améliorations vers la v2 ?

Basé sur les fonctions originales de chatyuan-large-v1, le modèle v2 a été optimisé comme suit :

Capacités de base améliorées : les questions et réponses contextuelles originales et les capacités d'écriture créative ont été considérablement améliorées.
Ajout de la possibilité de refuser de répondre : apprenez à refuser de répondre à certaines questions dangereuses et nuisibles.
Fonction de génération de code ajoutée : la génération de code de base a été optimisée dans une certaine mesure.
Fonction de génération de tableau ajoutée : contenu et format de tableau optimisés.
Capacités d'opérations mathématiques améliorées : les opérations mathématiques de base telles que l'addition et la soustraction ont été optimisées.
Longueur totale d'entrée et de sortie étendue : le nombre maximum de jetons de longueur est étendu à 4096.
Capacités de scénario de simulation améliorées : vous pouvez simuler des conversations à plusieurs personnes ou des scénarios spécifiques, et effectuer la création de contenu et l'interaction contextuelle dans des scénarios.
Ajout de capacités de dialogue bilingue chinois-anglais : interaction bilingue chinois-anglais nouvellement ajoutée, création en anglais, traduction et autres fonctions. "Capacité de rejet"

ChatGPT domestique est à nouveau open source ! Leffet a été considérablement amélioré et peut également être exécuté sur les téléphones mobiles. Génération de code

03 Limitations de la v2 ChatGPT domestique est à nouveau open source ! Leffet a été considérablement amélioré et peut également être exécuté sur les téléphones mobiles.

Étant donné que Chatyuan-large-v1 est un grand modèle léger, il y aura toujours certaines limitations et lacunes. Il est conseillé aux développeurs d'en être conscients, notamment :

Pour la mise en œuvre de base des fonctions de base de raisonnement, de calcul et de génération de code, il existe toujours le problème d'une formation insuffisante. Dans certains scénarios, des erreurs logiques se produiront. Par exemple, le code peut être fondamentalement implémenté et a la capacité de le faire. annoter, mais il ne peut pas être garanti qu'il soit rationalisé, fluide et précis, la visibilité doit être optimisée.
Les réponses des connaissances générales ne sont pas assez précises et les connaissances factuelles sont toujours inexactes.
Le traitement des informations contextuelles est encore insuffisant.

Conclusion

En général, la v2 s'est grandement améliorée par rapport au modèle open source v1 en termes de compréhension du contexte, de génération de contenu, de génération de table de codes, etc. Elle peut atteindre la base de dizaines de milliards d'échelles de paramètres dans l'industrie avec une échelle de paramètres de seulement 0,7B. L'effet est de réduire considérablement le coût du raisonnement et d'améliorer l'efficacité de l'utilisation.

Yuanyu Intelligence a déclaré que l'équipe adhérerait fermement à la voie de l'open source et continuerait à ouvrir des grands modèles à usage général de meilleure qualité et de plus grande taille à l'avenir, continuerait à construire un écosystème de développeurs open source et promouvrait le développement open source. Des grands modèles nationaux. Nous espérons que tous les amis nous critiqueront et nous corrigeront.

Invitation à des tests internes du produit

En plus de ce modèle open source ChatYuan-large-v2, l'équipe Yuanyu a officiellement lancé les tests internes du produit KnowX KnowX est équipé des capacités de grand modèle de la dernière version. de ChatYuan en ligne et est capable de compréhension contextuelle. Il présente d'excellentes performances en matière de génération de contenu, de génération de code, de calculs de raisonnement logique, etc. Afin de garantir la fiabilité, la stabilité et l'optimisation ultérieure de la version, le produit a maintenant été lancé pour tests internes. Le nombre de places est limité. Les amis intéressés peuvent postuler via le lien ci-dessous.

Canal d'application bêta interne :

https://wj.qq.com/s2/11984341/e00b/

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

Assassin's Creed Shadows - Comment trouver le forgeron et déverrouiller les armes et la personnalisation des armes

1 Il y a quelques mois By DDD

<🎜>: Dead Rails - Comment relever chaque défi

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7629

Tutoriel CakePHP

1389

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

141

Afficher plus

Related knowledge

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

L'IA bouleverse la recherche mathématique ! Le lauréat de la médaille Fields et mathématicien sino-américain a dirigé 11 articles les mieux classés | Aimé par Terence Tao Apr 09, 2024 am 11:52 AM

L’IA change effectivement les mathématiques. Récemment, Tao Zhexuan, qui a prêté une attention particulière à cette question, a transmis le dernier numéro du « Bulletin de l'American Mathematical Society » (Bulletin de l'American Mathematical Society). En se concentrant sur le thème « Les machines changeront-elles les mathématiques ? », de nombreux mathématiciens ont exprimé leurs opinions. L'ensemble du processus a été plein d'étincelles, intense et passionnant. L'auteur dispose d'une équipe solide, comprenant Akshay Venkatesh, lauréat de la médaille Fields, le mathématicien chinois Zheng Lejun, l'informaticien de l'Université de New York Ernest Davis et de nombreux autres universitaires bien connus du secteur. Le monde de l’IA a radicalement changé. Vous savez, bon nombre de ces articles ont été soumis il y a un an.

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas entre officiellement dans l’ère des robots électriques ! Hier, l'Atlas hydraulique s'est retiré "en larmes" de la scène de l'histoire. Aujourd'hui, Boston Dynamics a annoncé que l'Atlas électrique était au travail. Il semble que dans le domaine des robots humanoïdes commerciaux, Boston Dynamics soit déterminé à concurrencer Tesla. Après la sortie de la nouvelle vidéo, elle a déjà été visionnée par plus d’un million de personnes en seulement dix heures. Les personnes âgées partent et de nouveaux rôles apparaissent. C'est une nécessité historique. Il ne fait aucun doute que cette année est l’année explosive des robots humanoïdes. Les internautes ont commenté : Les progrès des robots ont fait ressembler la cérémonie d'ouverture de cette année à des êtres humains, et le degré de liberté est bien plus grand que celui des humains. Mais n'est-ce vraiment pas un film d'horreur ? Au début de la vidéo, Atlas est allongé calmement sur le sol, apparemment sur le dos. Ce qui suit est à couper le souffle

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Apr 03, 2024 am 11:55 AM

La technologie de détection et de reconnaissance des visages est déjà une technologie relativement mature et largement utilisée. Actuellement, le langage d'application Internet le plus utilisé est JS. La mise en œuvre de la détection et de la reconnaissance faciale sur le front-end Web présente des avantages et des inconvénients par rapport à la reconnaissance faciale back-end. Les avantages incluent la réduction de l'interaction réseau et de la reconnaissance en temps réel, ce qui réduit considérablement le temps d'attente des utilisateurs et améliore l'expérience utilisateur. Les inconvénients sont les suivants : il est limité par la taille du modèle et la précision est également limitée ; Comment utiliser js pour implémenter la détection de visage sur le web ? Afin de mettre en œuvre la reconnaissance faciale sur le Web, vous devez être familier avec les langages et technologies de programmation associés, tels que JavaScript, HTML, CSS, WebRTC, etc. Dans le même temps, vous devez également maîtriser les technologies pertinentes de vision par ordinateur et d’intelligence artificielle. Il convient de noter qu'en raison de la conception du côté Web

FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye Apr 26, 2024 am 11:37 AM

La détection de cibles est un problème relativement mature dans les systèmes de conduite autonome, parmi lesquels la détection des piétons est l'un des premiers algorithmes à être déployés. Des recherches très complètes ont été menées dans la plupart des articles. Cependant, la perception de la distance à l’aide de caméras fisheye pour une vue panoramique est relativement moins étudiée. En raison de la distorsion radiale importante, la représentation standard du cadre de délimitation est difficile à mettre en œuvre dans les caméras fisheye. Pour alléger la description ci-dessus, nous explorons les conceptions étendues de boîtes englobantes, d'ellipses et de polygones généraux dans des représentations polaires/angulaires et définissons une métrique de segmentation d'instance mIOU pour analyser ces représentations. Le modèle fisheyeDetNet proposé avec une forme polygonale surpasse les autres modèles et atteint simultanément 49,5 % de mAP sur l'ensemble de données de la caméra fisheye Valeo pour la conduite autonome.

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

See all articles