Le développement de l'ère des grands modèles d'IA nécessite une technologie de stockage avancée pour réaliser des progrès stables-IA-php.cn

Maison

Le développement de l'ère des grands modèles d'IA nécessite une technologie de stockage avancée pour réaliser des progrès stables

王林

Sep 19, 2023 am 09:05 AM

ai大模型 Des progrès constants avance rapide

La discipline de l'intelligence artificielle est née en 1956, puis n'a fait pratiquement aucun progrès au cours du demi-siècle suivant. Le développement de la puissance de calcul et des données était loin derrière les algorithmes. Cependant, avec l'avènement de l'ère Internet en 2000, les limites de la puissance de calcul ont été brisées, l'intelligence artificielle a progressivement pénétré tous les domaines de la vie et a inauguré l'ère des modèles à grande échelle. Cependant, les données de haute qualité semblent être devenues le dernier « goulot d'étranglement » dans le développement de l'intelligence artificielle

Huawei OceanStor Pacific a remporté le « Prix de la meilleure innovation pour la base de stockage IA » lors de la récente conférence annuelle nationale sur le calcul haute performance (CCF HPC China 2 doit être réécrit comme : 023)

Le développement de lère des grands modèles dIA nécessite une technologie de stockage avancée pour réaliser des progrès stables

L’émergence du concept de rétention de l’IA reflète en réalité l’amélioration continue de la valeur des données pour l’IA

Le contenu à réécrire est : 01

Les données déterminent le niveau d'intelligence de l'intelligence artificielle

Le développement de l’intelligence artificielle est un processus de collecte et d’analyse continue de données. Les données, en tant que vecteur d’informations, constituent la base de l’intelligence artificielle pour apprendre et comprendre le monde. L'intelligence générale est l'objectif ultime du développement de l'intelligence artificielle. Elle peut apprendre, comprendre, raisonner et résoudre des problèmes de manière autonome, et les données sont le principal moteur de son développement

Alors, plus il y a de données, plus l’IA devient intelligente ? Tant qu’il existe une grande quantité de données, l’IA peut-elle surpasser le rôle des experts ?

Prenons l'exemple des systèmes d'intelligence artificielle dans le domaine médical. De nombreux cas de diagnostic n'ont en réalité pas une seule bonne réponse. Dans le diagnostic médical, chaque ensemble de symptômes a une gamme de causes possibles avec des probabilités variables, de sorte que la prise de décision assistée par l'IA peut aider les cliniciens à affiner les causes possibles jusqu'à ce qu'une solution soit trouvée. Dans ce cas, l'intelligence artificielle médicale ne s'appuie pas sur de grandes quantités de données, mais sur des données précises et de haute qualité. Ce n'est qu'ainsi qu'elle peut garantir que les causes réelles possibles ne passent pas inaperçues lors du « dépistage »

L'importance de la qualité des données pour l'intelligence artificielle se reflète dans cette démonstration typique

Dans l'industrie de l'intelligence artificielle, il y a toujours eu un consensus selon lequel « les déchets entrent, les déchets sortent ». Cela signifie que sans saisie de données de haute qualité, quel que soit le degré d'avancement de l'algorithme ou la puissance de calcul de la puissance de calcul, il ne sera pas en mesure de produire des résultats de haute qualité

Le développement de lère des grands modèles dIA nécessite une technologie de stockage avancée pour réaliser des progrès stables

De nos jours, nous sommes à l’aube des grands modèles. De grands modèles d’intelligence artificielle poussent comme des champignons après la pluie. Un certain nombre de grands modèles en Chine, tels que Pangu de Huawei, Spark d'iFlytek et Taichu de Zidong, se développent rapidement et s'engagent à construire une plate-forme universelle intersectorielle de capacités d'intelligence artificielle pour fournir l'énergie nécessaire à la transformation numérique de tous les horizons.

Selon le « Rapport de recherche sur les grandes cartes de modèles d'intelligence artificielle de Chine » publié fin mai par le Centre de recherche sur le développement de l'intelligence artificielle de nouvelle génération du ministère chinois des Sciences et des Technologies, 79 grands modèles d'une échelle de plus d'un milliard les paramètres ont été publiés en Chine. Bien que le schéma de la « Bataille des 100 modèles » ait été formé, il a également déclenché une réflexion approfondie sur le développement de grands modèles

Les capacités d'expression des modèles basés sur des données à petite échelle sont limitées par la taille des données. Ils ne peuvent effectuer que des simulations et des prédictions à gros grain et ne sont plus applicables dans les situations où les exigences de précision sont relativement élevées. Si vous souhaitez améliorer encore la précision du modèle, vous devez utiliser des données massives pour générer des modèles pertinents

Le contenu réécrit est le suivant : cela signifie que la quantité de données détermine le degré d'intelligence de l'IA. Quelle que soit la qualité des données, la quantité de données est un domaine d’intérêt qui doit être axé sur le renforcement de la « capacité de stockage de l’IA »

Ce qu'il faut réécrire c'est : 02

A l'ère du big data, les enjeux de la data

À mesure que l'intelligence artificielle évolue vers les grands modèles et la multimodalité, les entreprises sont confrontées à de nombreux défis lors du développement ou de la mise en œuvre d'applications à grands modèles

Le développement de lère des grands modèles dIA nécessite une technologie de stockage avancée pour réaliser des progrès stables

Tout d’abord, le cycle de prétraitement des données est très long. Étant donné que les données sont distribuées dans différents centres de données, différentes applications et différents systèmes, il existe des problèmes tels qu'une vitesse de collecte lente. Par conséquent, il faut environ 10 jours pour prétraiter 100 To de données. L'utilisation du système doit être améliorée. début.

Deuxièmement, le problème de la faible efficacité de chargement des ensembles d'entraînement doit être résolu. De nos jours, l'échelle des modèles à grande échelle devient de plus en plus grande, avec des niveaux de paramètres atteignant des centaines de milliards, voire des milliards. Le processus de formation nécessite une grande quantité de ressources informatiques et d'espace de stockage. Par exemple, les modèles multimodaux à grande échelle utilisent des textes et des images massifs comme ensembles de formation, mais la vitesse de chargement actuelle de petits fichiers volumineux est lente, ce qui entraîne un chargement inefficace des ensembles de formation

De plus, nous sommes également confrontés aux défis liés au réglage fréquent des paramètres des grands modèles et aux plateformes de formation instables, avec des interruptions de formation se produisant en moyenne tous les deux jours. Afin de reprendre la formation, un mécanisme de point de contrôle doit être utilisé et le temps de récupération après une panne dépasse une journée, ce qui pose de nombreux défis pour la continuité des activités

Pour réussir dans l'ère du grand modèle d'IA, nous devons prêter attention à la fois à la qualité et à la quantité des données et construire une infrastructure de stockage de grande capacité et hautes performances. C'est devenu un élément clé de la victoire

Le contenu à réécrire est : 03

La clé de l'ère de l'IA est la base de stockage d'énergie

Avec la combinaison du big data, de l'intelligence artificielle et d'autres technologies avec le calcul haute performance, l'analyse de données haute performance (HPDA) est devenue une nouvelle forme de valorisation des données. En utilisant davantage de données historiques, de multiples puissances de calcul et méthodes d’analyse hétérogènes, HPDA peut améliorer la précision de l’analyse. Cela marque une nouvelle étape de la recherche intelligente dans la recherche scientifique, et la technologie de l'intelligence artificielle accélérera l'application de résultats de pointe

Aujourd'hui, un nouveau paradigme basé sur la « data-intensive science » émerge dans le domaine de la recherche scientifique. Ce paradigme se concentre davantage sur la combinaison de l’exploration de connaissances Big Data et de la formation et de la technologie de raisonnement en intelligence artificielle pour obtenir de nouvelles connaissances et découvertes grâce au calcul et à l’analyse. Cela signifie également que les exigences relatives à l’infrastructure de données sous-jacente vont fondamentalement changer. Qu'il s'agisse du calcul haute performance ou du développement futur de l'intelligence artificielle, une infrastructure de stockage avancée doit être mise en place pour relever les défis liés aux données

Le développement de lère des grands modèles dIA nécessite une technologie de stockage avancée pour réaliser des progrès stables

Pour résoudre les problèmes liés aux données, nous devons commencer par innover en matière de stockage de données. Comme le dit le proverbe, celui qui a détaché la cloche doit attacher la cloche

La base de stockage AI est développée sur la base du stockage distribué OceanStor Pacific et adhère au concept de conception AI Native pour répondre aux besoins de stockage de tous les aspects de l'IA. Les systèmes d'IA posent de nombreux défis en matière de stockage, notamment l'accélération du calcul des données, la gestion du stockage des données et une circulation efficace entre le stockage des données et l'informatique. En utilisant une combinaison de « stockage de grande capacité + stockage haute performance », nous pouvons assurer la planification et la coordination des ressources de stockage, afin que chaque lien puisse fonctionner efficacement, libérant ainsi pleinement la valeur du système d'IA

Comment le stockage distribué OceanStor Pacific démontre-t-il ses principales capacités ?

Tout d’abord, l’architecture technique est unique dans l’industrie. Ce système de stockage prend en charge une expansion horizontale illimitée et peut gérer des charges mixtes. Il peut gérer efficacement les IOPS de petits fichiers et la bande passante de lecture et d'écriture à grande vitesse de gros fichiers. Il dispose de fonctions de flux de données hiérarchiques intelligentes au niveau des couches de performances et de capacité, et peut réaliser une gestion complète des données d'IA telles que la collecte, le prétraitement, la formation et l'inférence de données massives. De plus, il possède les mêmes capacités d'analyse de données que le HPC et le big data

Le contenu réécrit est le suivant : Deuxièmement, la meilleure façon d'améliorer l'efficacité dans l'industrie passe par l'innovation en matière de stockage. Le premier est le tissage de données, c'est-à-dire l'accès aux données brutes dispersées dans différentes régions via le système de fichiers global GFS pour obtenir une vue et une planification des données globales unifiées entre les systèmes, les régions et plusieurs cloud, simplifiant ainsi le processus de collecte de données. Le second est l'informatique en mémoire proche, qui réalise le prétraitement des données proches en stockant la puissance de calcul intégrée, réduit la transmission de données non valides et réduit le temps d'attente du serveur de prétraitement, améliorant ainsi considérablement l'efficacité du prétraitement

En fait, la « Bataille de centaines de modèles » n'est pas un « signe » du développement de grands modèles d'IA. À l'avenir, tous les horizons utiliseront les capacités des grands modèles d'IA pour promouvoir le développement en profondeur de la transformation numérique, et la construction d'infrastructures de données sera également accélérée. L’innovation du stockage distribué OceanStor Pacific en matière d’architecture technologique et de haute efficacité s’est avérée être le premier choix de l’industrie

Nous comprenons que les données sont devenues un nouveau facteur de production aux côtés de la terre, du travail, du capital et de la technologie. De nombreuses définitions et modèles de fonctionnement traditionnels du marché numérique passé seront réécrits. Ce n'est qu'avec des capacités préexistantes que nous pouvons assurer la progression constante de l'ère des grands modèles d'intelligence artificielle basés sur les données

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7478

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Les grands modèles d'IA sont très chers et seules les grandes entreprises et les super riches peuvent les utiliser avec succès Apr 15, 2023 pm 07:34 PM

L'incendie de ChatGPT a déclenché une nouvelle vague d'engouement pour l'IA. Cependant, l'industrie estime généralement que lorsque l'IA entre dans l'ère des grands modèles, seules les grandes entreprises et les entreprises très riches peuvent se permettre l'IA, car la création de grands modèles d'IA coûte très cher. . La première est que cela coûte cher en termes de calcul. Avi Goldfarb, professeur de marketing à l'Université de Toronto, a déclaré : « Si vous souhaitez démarrer une entreprise, développer vous-même un grand modèle de langage et le calculer vous-même, le coût est trop élevé. OpenAI est très cher, coûtant des milliards de dollars. " L'informatique en location sera certainement beaucoup moins chère, mais les entreprises doivent toujours payer des frais élevés à AWS et à d'autres sociétés. Deuxièmement, les données coûtent cher. Les modèles de formation nécessitent des quantités massives de données, parfois les données sont facilement disponibles et parfois non. Des données comme CommonCrawl et LAION peuvent être gratuites

Comment construire un système de gouvernance des données orienté IA ? Apr 12, 2024 pm 02:31 PM

Ces dernières années, avec l'émergence de nouveaux modèles technologiques, la valorisation des scénarios d'application dans diverses industries et l'amélioration des effets produits grâce à l'accumulation de données massives, les applications de l'intelligence artificielle ont rayonné dans des domaines tels que la consommation et Internet. aux industries traditionnelles telles que l’industrie manufacturière, l’énergie et l’électricité. La maturité de la technologie de l'intelligence artificielle et son application dans les entreprises de divers secteurs dans les principaux maillons des activités de production économique telles que la conception, l'approvisionnement, la production, la gestion et les ventes s'améliorent constamment, accélérant la mise en œuvre et la couverture de l'intelligence artificielle dans tous les maillons, et l'intégrer progressivement à l'activité principale, afin d'améliorer le statut industriel ou d'optimiser l'efficacité opérationnelle, et d'étendre davantage ses propres avantages. La mise en œuvre à grande échelle d'applications innovantes de la technologie de l'intelligence artificielle a favorisé le développement vigoureux du marché de l'intelligence Big Data et a également injecté une vitalité au marché dans les services sous-jacents de gouvernance des données. Avec le big data, le cloud computing et l'informatique

Vulgarisation scientifique : Qu'est-ce qu'un grand modèle d'IA ? Jun 29, 2023 am 08:37 AM

Les grands modèles d’IA font référence à des modèles d’intelligence artificielle entraînés à l’aide de données à grande échelle et d’une puissance de calcul puissante. Ces modèles ont généralement un haut degré de précision et de capacités de généralisation et peuvent être appliqués à divers domaines tels que le traitement du langage naturel, la reconnaissance d'images, la reconnaissance vocale, etc. La formation de grands modèles d'IA nécessite une grande quantité de données et de ressources informatiques, et il est généralement nécessaire d'utiliser un cadre informatique distribué pour accélérer le processus de formation. Le processus de formation de ces modèles est très complexe et nécessite une recherche approfondie et une optimisation de la distribution des données, de la sélection des fonctionnalités, de la structure du modèle, etc. Les grands modèles d'IA ont un large éventail d'applications et peuvent être utilisés dans divers scénarios, tels que le service client intelligent, les maisons intelligentes, la conduite autonome, etc. Dans ces applications, les grands modèles d’IA peuvent aider les utilisateurs à effectuer diverses tâches plus rapidement et plus précisément, et à améliorer l’efficacité du travail.

À l'ère des grands modèles d'IA, les nouvelles bases de stockage de données favorisent la transition vers l'intelligence numérique de l'éducation et de la recherche scientifique Jul 21, 2023 pm 09:53 PM

L'IA générative (AIGC) a ouvert une nouvelle ère d'intelligence artificielle générale. La concurrence autour des grands modèles est devenue spectaculaire. L'infrastructure informatique est le principal objectif de la concurrence, et la prise de pouvoir devient de plus en plus un consensus industriel. Dans la nouvelle ère, les grands modèles passent d'une modalité unique à une multimodalité, la taille des paramètres et des ensembles de données d'entraînement augmente de façon exponentielle et les données massives non structurées nécessitent en même temps la prise en charge de capacités de charge mixtes hautes performances ; gourmand en données Le nouveau paradigme gagne en popularité et les scénarios d'application tels que le calcul intensif et le calcul haute performance (HPC) évoluent en profondeur. Les bases de stockage de données existantes ne sont plus en mesure de répondre aux besoins en constante évolution. Si la puissance de calcul, les algorithmes et les données constituent la « troïka » qui conduit le développement de l'intelligence artificielle, alors dans le contexte d'énormes changements dans l'environnement externe, les trois doivent de toute urgence retrouver un dynamisme

Vivo lance un modèle d'IA polyvalent auto-développé - Blue Heart Model Nov 01, 2023 pm 02:37 PM

Vivo a publié sa matrice de grands modèles d'intelligence artificielle générale auto-développée - le modèle Blue Heart lors de la conférence des développeurs 2023 le 1er novembre. Vivo a annoncé que le modèle Blue Heart lancerait 5 modèles avec différents niveaux de paramètres, respectivement. : milliards, dizaines de milliards et centaines de milliards, couvrant les scénarios de base, et ses capacités de modèle occupent une position de leader dans l'industrie. Vivo estime qu'un bon grand modèle auto-développé doit répondre aux cinq exigences suivantes : des fonctions complètes à grande échelle, des algorithmes puissants, une évolution sûre et fiable, indépendante, et doit être largement open source. Le contenu réécrit est le suivant : Parmi eux. , le premier est le modèle Blue Heart Model 7B, qui est un modèle de niveau 7 milliards, conçu pour fournir un double service pour les téléphones mobiles et le cloud. Vivo a déclaré que ce modèle peut être utilisé dans des domaines tels que la compréhension du langage et la création de textes.

En ce qui concerne le cerveau humain, apprendre à oublier améliorera-t-il les grands modèles d'IA ? Mar 12, 2024 pm 02:43 PM

Récemment, une équipe d’informaticiens a développé un modèle d’apprentissage automatique plus flexible et plus résilient, capable d’oublier périodiquement des informations connues, une fonctionnalité que l’on ne trouve pas dans les modèles de langage à grande échelle existants. Les mesures réelles montrent que dans de nombreux cas, la « méthode d'oubli » est très efficace dans l'entraînement et que le modèle d'oubli sera plus performant. Jea Kwon, ingénieur en IA à l'Institut des sciences fondamentales de Corée, a déclaré que ces nouvelles recherches signifiaient des progrès significatifs dans le domaine de l'IA. L'efficacité de la formation par « méthode d'oubli » est très élevée. La plupart des moteurs de langage d'IA grand public actuels utilisent la technologie des réseaux neuronaux artificiels. Chaque « neurone » de cette structure de réseau est en réalité une fonction mathématique. Ils sont connectés les uns aux autres pour recevoir et transmettre des informations.

Les grands modèles d'IA sont populaires ! Les géants de la technologie se sont joints à nous et les politiques adoptées dans de nombreux endroits ont accéléré leur mise en œuvre. Jun 11, 2023 pm 03:09 PM

Ces derniers temps, l’intelligence artificielle est redevenue le centre de l’innovation humaine, et la concurrence en matière d’armement autour de l’IA est devenue plus intense que jamais. Non seulement les géants de la technologie se rassemblent pour se joindre à la bataille des grands modèles de peur de passer à côté de la nouvelle tendance, mais même Pékin, Shanghai, Shenzhen et d'autres endroits ont également introduit des politiques et des mesures pour mener des recherches sur les algorithmes et les clés d'innovation des grands modèles. technologies pour créer un haut lieu de l'innovation en matière d'intelligence artificielle. Les grands modèles d'IA sont en plein essor et les grands géants de la technologie se sont joints à eux. Récemment, le « Rapport de recherche sur les grandes cartes de modèles d'intelligence artificielle de Chine » publié lors du Forum Zhongguancun 2023 montre que les grands modèles d'intelligence artificielle chinoise affichent une tendance de développement en plein essor, et il y a de nombreuses entreprises du secteur. Robin Li, fondateur, président et PDG de Baidu, a déclaré sans détour que nous sommes à un nouveau point de départ.

Réservation de conférence | Cinq experts ont discuté : Sous la vague des nouvelles technologies, comment les grands modèles d'IA affectent-ils la recherche et le développement de nouveaux médicaments ? Jun 08, 2023 am 11:27 AM

En 1978, Stuart Marson et d'autres de l'Université de Californie ont créé la première société commerciale CADD au monde et ont été pionniers dans le développement d'un système de réaction chimique et de récupération de bases de données. Depuis lors, la conception de médicaments assistée par ordinateur (CADD) est entrée dans une ère de développement rapide et est devenue l'un des moyens importants permettant aux sociétés pharmaceutiques de mener des recherches et des développements de médicaments, apportant des améliorations révolutionnaires dans ce domaine. Le 5 octobre 1981, le magazine Fortune a publié un article de couverture intitulé « La prochaine révolution industrielle : Merck conçoit des médicaments via des ordinateurs », annonçant officiellement l'avènement de la technologie CADD. En 1996, le premier médicament inhibiteur de l'anhydrase carbonique développé sur la base du SBDD (structure-based drug design) a été lancé avec succès sur le marché. Le CADD a été largement utilisé dans la recherche et le développement de médicaments.

See all articles