Maison Périphériques technologiques IA Les tests internes de Kimi Chat démarrent, Volcano Engine fournit des solutions d'accélération, prend en charge la formation et l'inférence du service de grands modèles Moonshot AI

Les tests internes de Kimi Chat démarrent, Volcano Engine fournit des solutions d'accélération, prend en charge la formation et l'inférence du service de grands modèles Moonshot AI

Oct 11, 2023 pm 01:45 PM

Le 9 octobre, Beijing Dark Side of the Moon Technology Co., Ltd. (Moonshot AI) a annoncé une percée dans le domaine du « texte long » et a lancé Kimi Chat, le premier produit d'assistant intelligent prenant en charge la saisie de 200 000 caractères chinois. Il s'agit de la longueur d'entrée de contexte la plus longue pouvant être prise en charge par un service de grand modèle pouvant être utilisé commercialement sur le marché mondial, marquant le leadership mondial de Moonshot AI dans cette technologie importante.

Le Volcano Engine entretient une coopération approfondie avec Moonshot AI pour lui fournir exclusivement des solutions de formation en IA et d'accélération d'inférence hautement stables et rentables. Les deux parties mènent conjointement des recherches et des développements technologiques pour promouvoir conjointement l'application de grands modèles de langage dans le domaine vertical. champs et scénarios généraux. Dans le même temps, Kimi Chat rejoindra bientôt la plate-forme de services pour grands modèles Volcano Engine - Volcano Ark. Les deux parties continueront de fournir aux entreprises et aux consommateurs des applications d'IA plus riches dans le domaine de l'écologie des grands modèles.

Par rapport aux grands services actuels sur le marché qui sont formés sur la base de l'anglais, Kimi Chat possède de fortes capacités multilingues. Par exemple, Kimi Chat présente des avantages significatifs en chinois, et l'effet d'utilisation réel peut prendre en charge le contexte d'environ 200 000 personnes. Caractères chinois. 2,5 fois celui du Claude-100k d'Anthropic (mesuré en réalité environ 80 000 mots) et 8 fois celui du GPT-4-32k d'OpenAI (mesuré en réalité environ 25 000 mots). Dans le même temps, Kimi Chat peut réaliser un mécanisme d'attention à longue portée sans perte sous des centaines de milliards de paramètres grâce à une structure de réseau innovante et à une optimisation technique, et ne s'appuie pas sur des solutions de « raccourci » telles que les fenêtres coulissantes, le sous-échantillonnage et les petits modèles qui peut grandement nuire aux performances.

Dans une précédente interview, Yang Zhilin, le fondateur de Moonshot AI, a déclaré un jour que la compression sans perte de données massives peut atteindre un haut degré d'intelligence, qu'il s'agisse de texte, de voix ou de vidéo. La limite supérieure des capacités d'un grand modèle (c'est-à-dire le taux de compression sans perte) est déterminée à la fois par la capacité en une seule étape et par le nombre d'étapes exécutées. La première est liée au nombre de paramètres et la seconde fait référence à la longueur du contexte

.

Relever les défis liés à la mise en œuvre de grands modèles de langage et promouvoir la mise en œuvre d'applications industrielles

Moonshot AI estime que l'augmentation de la longueur du contexte peut apporter de nouvelles opportunités de développement aux applications de modèles à grande échelle, lui permettant d'entrer dans l'ère Long LLM (LLLM) à partir de l'ère LLM et de parvenir à une adaptation précise à diverses industries. Lors de l'exploration de méthodes efficaces pour traiter de longues scènes de texte, les applications de modèles à grande échelle doivent continuellement explorer de nouveaux moyens pour résoudre le problème de l'illusion du modèle et améliorer la contrôlabilité du contenu généré, tout en recherchant de nouvelles voies pour le développement de capacités de modèles personnalisés à grande échelle. . Dans le processus de développement de modèles de langage à grande échelle, il est nécessaire de surmonter plusieurs seuils tels que l'expansion des besoins en ressources informatiques, l'instabilité de l'ingénierie des tâches, les coûts de projet élevés, la sécurité et la confiance, etc., pour améliorer l'efficacité de la formation du modèle

Afin de résoudre les problèmes ci-dessus, Moonshot AI s'est associé à Volcano Engine pour innover dans la technologie de l'IA et mener des pratiques AGI sur la plateforme d'apprentissage automatique Volcano Engine veMLP. Moonshot AI utilise pleinement le pool de ressources GPU et s'appuie sur des modèles de pré-entraînement à grande échelle pour obtenir un entraînement normal et stable à une échelle de milliers de calories par jour. En six mois, il a formé un grand modèle de langage avec Kimi Chat. une échelle de centaines de milliards de paramètres, déverrouillant l'écriture de scènes professionnelles et des textes ultra-longs. Il peut comprendre des scénarios complexes tels que l'analyse, un dialogue personnalisé avec une mémoire ultra-longue et des questions-réponses de connaissances basées sur un grand nombre de documents. utilisé avec succès dans de nombreuses entreprises renommées.

Zhou Xinyu, co-fondateur de Moonshot AI, a déclaré : « Moonshot AI se concentre sur l'exploration des limites de l'intelligence artificielle générale et s'engage à transformer la puissance de calcul en solutions intelligentes optimales. Volcano Engine dispose de capacités d'infrastructure et de réserves de puissance de calcul de premier plan au niveau national. À l'avenir, les deux parties Nous coopérerons davantage dans des domaines tels que l'infrastructure informatique de l'IA et l'expansion des scénarios d'application pour promouvoir conjointement le développement de la technologie de l'intelligence artificielle et offrir aux utilisateurs une expérience de service stable, efficace et intelligente.

En utilisant la plateforme d'apprentissage automatique Volcano Engine, la formation de grands modèles peut être plus stable et plus rapide

Le Volcano Engine fournit des solutions de formation et d'accélération d'inférence très stables et rentables pour la construction et la formation de grands modèles. Sa plate-forme d'apprentissage automatique veMLP a été peaufinée depuis longtemps par de grandes entreprises utilisatrices telles que Douyin et a formé une plateforme d'apprentissage automatique. Optimisation de l'ingénierie du développement de l'IA full-stack. Les solutions et les meilleures pratiques telles que les solutions, l'auto-réparation des erreurs de tâche et l'observabilité expérimentale fournissent des services de développement et d'itération d'algorithmes d'IA à guichet unique efficaces, stables, sécurisés et mutuellement fiables, ce qui accélère la formation de grands modèles. , plus stable et plus rentable. Moonshot AI est basé sur la solution de formation et d'accélération d'inférence d'IA à très grande échelle fournie par Volcano Engine, aidant l'équipe à réaliser des itérations de formation continue, un réglage fin et une inférence de grands modèles de langage de manière rapide, stable et à faible coût.

1. Planification évolutive de la puissance de calcul et des ressources de stockage IaaS

Construire un cluster informatique haute performance pour atteindre une formation de grands modèles de niveau 10 000 ka, un réseau de retard de niveau microseconde et un calcul élastique peut économiser 70 % des coûts de puissance de calcul ; utilisez la solution d'accélération à chaud et à froid vePFS+TOS pour répondre aux exigences. un débit élevé de données de formation tout en garantissant une réduction globale des coûts de stockage de 65 %. Pour le modèle de lecture et d'écriture du système de fichiers des grands modèles, nous avons développé conjointement un système de mise en cache de fichiers dédié pour améliorer considérablement l'utilisation de la carte graphique.

2. Assurer la stabilité du cluster informatique PaaS

Optimisez la stabilité des très grands clusters de formation, fournissez une optimisation d'auto-réparation des pannes matérielles et des capacités de diagnostic indépendantes, permettez aux tâches des utilisateurs de réessayer et de reprendre rapidement la formation, d'obtenir une formation stable au niveau mensuel et de réduire RingAllReduce grâce à l'optimisation de l'affinité de communication de plusieurs machines. tâches de formation Communiquer entre les commutateurs.

3. Expérimentez avec une observabilité élevée

Gestion des expériences pour plusieurs tâches de formation et comparaison des résultats de la formation via la visualisation pour déterminer le modèle pour l'itération et le lancement en ligne ; utiliser des journaux de surveillance complets pour aider l'entreprise à ajuster les paramètres parallèles 3D et à localiser les défauts de formation

Solution de sécurité et de confiance mutuelle pour les services de grands modèles

Combine une informatique de confidentialité fiable avec des applications LLM pour fournir des fonctions de bac à sable de sécurité et améliorer le contrôle des autorisations des développeurs. Le moteur Volcano fonctionne également avec Moonshot AI pour concevoir un flux de travail adapté aux habitudes de développement de grands modèles, garantissant un accès hiérarchique aux données et garantissant la sécurité des données tout en garantissant l'efficacité du travail.

Wu Di, responsable de l'algorithme intelligent de Volcano Engine, a déclaré : « Volcano Engine a toujours adhéré à une attitude coopérative consistant à se concentrer sur la technologie, à responsabiliser les partenaires et à la symbiose des valeurs. Moonshot AI possède l'équipe de R&D sur grands modèles la plus avancée du monde. Chine et possède une compréhension approfondie et une expérience d'application de la technologie de l'IA, la coopération entre les deux parties fournira en outre aux entreprises et aux consommateurs des applications d'IA plus riches dans le domaine des services écologiques multimodèles.

Kimi Chat内测启动,火山引擎提供加速解决方案,支持Moonshot AI大模型服务的训练和推理

Vue panoramique sur l'arche du volcan

Actuellement, Volcano Ark a attiré de grands modèles de nombreuses entreprises de technologie d'IA et instituts de recherche scientifique tels que Zhipu AI, Minimax et ByteDance Skylark. Le service de grands modèles de Moonshot AI, Kimi Chat, arrive également sur Volcano Ark. Volcano Engine coopérera avec d'excellents fournisseurs nationaux de services de grands modèles pour fournir une gamme complète de fonctions et de services tels que la formation de modèles, l'inférence, l'évaluation et le réglage fin pour aider tous les horizons à accélérer le développement de l'IA. Toutes les entreprises sont invitées à découvrir de grands modèles dans Volcano Ark. Volcano Ark est prêt à grandir avec tout le monde !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! J'ai essayé le codage d'ambiance avec Cursor Ai et c'est incroyable! Mar 20, 2025 pm 03:34 PM

Le codage des ambiances est de remodeler le monde du développement de logiciels en nous permettant de créer des applications en utilisant le langage naturel au lieu de lignes de code sans fin. Inspirée par des visionnaires comme Andrej Karpathy, cette approche innovante permet de dev

Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Top 5 Genai Lunets de février 2025: GPT-4.5, Grok-3 et plus! Mar 22, 2025 am 10:58 AM

Février 2025 a été un autre mois qui change la donne pour une IA générative, nous apportant certaines des mises à niveau des modèles les plus attendues et de nouvelles fonctionnalités révolutionnaires. De Xai's Grok 3 et Anthropic's Claude 3.7 Sonnet, à Openai's G

Comment utiliser YOLO V12 pour la détection d'objets? Comment utiliser YOLO V12 pour la détection d'objets? Mar 22, 2025 am 11:07 AM

Yolo (vous ne regardez qu'une seule fois) a été un cadre de détection d'objets en temps réel de premier plan, chaque itération améliorant les versions précédentes. La dernière version Yolo V12 introduit des progrès qui améliorent considérablement la précision

Chatgpt 4 o est-il disponible? Chatgpt 4 o est-il disponible? Mar 28, 2025 pm 05:29 PM

Chatgpt 4 est actuellement disponible et largement utilisé, démontrant des améliorations significatives dans la compréhension du contexte et la génération de réponses cohérentes par rapport à ses prédécesseurs comme Chatgpt 3.5. Les développements futurs peuvent inclure un interg plus personnalisé

Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Meilleurs générateurs d'art AI (gratuit & amp; payé) pour des projets créatifs Apr 02, 2025 pm 06:10 PM

L'article passe en revue les meilleurs générateurs d'art AI, discutant de leurs fonctionnalités, de leur aptitude aux projets créatifs et de la valeur. Il met en évidence MidJourney comme la meilleure valeur pour les professionnels et recommande Dall-E 2 pour un art personnalisable de haute qualité.

O1 vs GPT-4O: le nouveau modèle Openai est-il meilleur que GPT-4O? O1 vs GPT-4O: le nouveau modèle Openai est-il meilleur que GPT-4O? Mar 16, 2025 am 11:47 AM

O1'S O1: Une vague de cadeaux de 12 jours commence par leur modèle le plus puissant à ce jour L'arrivée de décembre apporte un ralentissement mondial, les flocons de neige dans certaines parties du monde, mais Openai ne fait que commencer. Sam Altman et son équipe lancent un cadeau de don de 12 jours

Google & # 039; s Gencast: Prévision météorologique avec Mini démo Gencast Google & # 039; s Gencast: Prévision météorologique avec Mini démo Gencast Mar 16, 2025 pm 01:46 PM

Gencast de Google Deepmind: une IA révolutionnaire pour les prévisions météorologiques Les prévisions météorologiques ont subi une transformation spectaculaire, passant des observations rudimentaires aux prédictions sophistiquées alimentées par l'IA. Gencast de Google Deepmind, un terreau

Quelle IA est la meilleure que Chatgpt? Quelle IA est la meilleure que Chatgpt? Mar 18, 2025 pm 06:05 PM

L'article traite des modèles d'IA dépassant Chatgpt, comme Lamda, Llama et Grok, mettant en évidence leurs avantages en matière de précision, de compréhension et d'impact de l'industrie. (159 caractères)

See all articles