communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > Périphériques technologiques > Industrie informatique > Sortie de la version 1.2 de Moore Thread « KUAE Intelligent Computing Cluster KUAE » : prend en charge le texte long de 64 Ko, ajoute la série complète LLaMA2 de grands modèles, etc.

Sortie de la version 1.2 de Moore Thread « KUAE Intelligent Computing Cluster KUAE » : prend en charge le texte long de 64 Ko, ajoute la série complète LLaMA2 de grands modèles, etc.

王林

Libérer： 2024-08-20 07:32:37

original

393 Les gens l'ont consulté

Selon les informations de ce site du 19 août, la version 1.2 du fil de discussion de Moore « KUAE Intelligent Computing Cluster » a été officiellement publiée. Cette version optimise l'exhaustivité des niveaux logiciels et matériels, prend en charge le texte long de 64 Ko, ajoute une gamme complète de grands modèles LLaMA2, Baichuan, Yayi, Qwen2, Mixtral (MoE 8x7B) et d'autres modèles.

摩尔线程“夸娥智算集群 KUAE” 1.2 版本发布：支持 64K 长文本、新增 LLaMA2 全系列大模型等

Mise à jour du contenu :

Promotion MFU# 🎜🎜#
- La formation en cluster modèle dense MFU atteint jusqu'à 55%.
Optimisation Flash Attention2
64K Prise en charge des textes longs
Prend en charge le modèle expert mixte MoE
Continuer l'entraînement au point d'arrêt
Optimisation de DeepSpeed
- Convient à de nombreux grands modèles au pays et à l'étranger.
Amélioration de la stabilité
- Présentation de la fonction de fiabilité KUAE Aegis pour renforcer les capacités de surveillance, de diagnostic automatique et de récupération des pannes.
Visualisation/observabilité
Nouveau grand modèle ajouté à la bibliothèque de modèles intégrée
#🎜🎜 #Ajout de la série complète LLaMA2, Baichuan, Yayi, Qwen2, Mixtral (MoE 8x7B) et d'autres modèles.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées：

摩尔线程 Cluster informatique intelligent de Kua'e

Article précédent：Yuan Bingsong, le fondateur de Laidian Technology, aurait perdu contact. La société mère a répondu qu'« il avait démissionné depuis longtemps et n'avait rien à voir avec l'entreprise ». Article suivant：Histoire intérieure du dysfonctionnement de NetEase Cloud Music : la technologie réduit les coûts et augmente l'efficacité, mais l'enquête a pris beaucoup de temps en raison du manque de main-d'œuvre

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Difficulté à mettre à jour la mise en cache des pages Web officielles du compte: comment éviter l'ancien cache affectant l'expérience utilisateur après la mise à jour de la version?

2025-03-04 13:24:15
fourchettes

2025-02-28 14:39:11
Formation de grands modèles de langue: de TRPO à Grpo

2025-02-26 04:41:08
Économie de l'hébergement des LLM open source

2025-02-26 03:15:10
Lorsque les machines pensent à l'avance: la montée de l'IA stratégique

2025-02-26 03:06:12
Comprendre l'évolution de Chatgpt: Partie 3- Insignes de Codex et Instructgpt

2025-02-26 02:58:10
Formulation de circuits de fonction avec des autoencodeurs clairsemés dans LLM

2025-02-26 01:46:08
Le mathing derrière l'apprentissage dans le contexte

2025-02-26 00:03:10
Du curriculum vitae à la lettre de motivation en utilisant AI et LLM, avec Python et rationalisation

2025-02-25 23:59:12
Reft est-il tout ce dont nous avions besoin?

2025-02-25 19:49:12

Derniers numéros

Top 10 des meilleurs outils de vérificateur de backlink gratuit en 2025

2025-03-21 08:28:13
Un autre produit national de Baidu est lié à Deepseek.

2025-03-12 13:48:02
Derrière le premier accès Android à Deepseek: voir le pouvoir des femmes

2025-03-12 12:27:01
Le profit 'incroyable' de Deepseek: la marge bénéficiaire théorique est aussi élevée que 545%!

2025-03-12 12:21:01
Midea lance son premier climatiseur Deepseek: l'interaction vocale AI peut réaliser 400 000 commandes!

2025-03-12 12:18:02

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal