Table des matières
L'évolution de la relation entre données et puissance de calcul et les enjeux qui en découlent
La voie révolutionnaire de la base de données intégrée unifiée de stockage distribué
L'image future de HPDA+AI à l'ère des grands modèles
Maison Périphériques technologiques IA À l'ère des grands modèles d'IA, les nouvelles bases de stockage de données favorisent la transition vers l'intelligence numérique de l'éducation et de la recherche scientifique

À l'ère des grands modèles d'IA, les nouvelles bases de stockage de données favorisent la transition vers l'intelligence numérique de l'éducation et de la recherche scientifique

Jul 21, 2023 pm 09:53 PM
ai大模型 数据存储 教科研数智化

L'IA générative (AIGC) a ouvert une nouvelle ère de l'intelligence artificielle générale. La concurrence autour des grands modèles est spectaculaire. L'infrastructure informatique est le principal objectif de la concurrence, et l'éveil du pouvoir devient de plus en plus un consensus industriel.

À lère des grands modèles dIA, les nouvelles bases de stockage de données favorisent la transition vers lintelligence numérique de léducation et de la recherche scientifique

Dans la nouvelle ère, les grands modèles passent d'une modalité unique à la multimodalité, la taille des paramètres et des ensembles de données d'entraînement augmente de façon exponentielle et les données massives non structurées nécessitent en même temps la prise en charge de capacités de charge mixtes hautes performances ; Les paradigmes gourmands en données deviennent populaires et les scénarios d'application tels que le calcul intensif et le calcul haute performance (HPC) évoluent en profondeur. Les bases de stockage de données existantes ne sont plus en mesure de répondre aux besoins de mises à niveau continues.

Si la puissance de calcul, les algorithmes et les données constituent la « troïka » qui conduit le développement de l'intelligence artificielle, alors dans le contexte d'énormes changements dans l'environnement externe, les trois doivent de toute urgence retrouver un équilibre dynamique. L'amélioration de la « puissance douce » provoquée par l'amélioration des modèles d'algorithmes et l'amélioration de la « puissance dure » provoquée par l'optimisation de l'alimentation en énergie de calcul nécessitent un soutien supplémentaire - la « capacité » de transmission des données et la « capacité de stockage » des données. le stockage doit être amélioré.En tant que source d'énergie, de nouvelles bases de stockage de données sortiront du cocon et deviendront un papillon en train de relever de nombreux défis.

Les scénarios d'application avec des exigences complexes et en constante évolution sont la meilleure pierre de touche pour de nouvelles bases de stockage de données. En ce sens, le secteur de l’enseignement et de la recherche scientifique en est un représentant typique : la puissance de calcul et les données sont des éléments clés de la transformation numérique dans ce domaine, et le calcul pour la recherche scientifique avec intégration disciplinaire est tout aussi important que l’aide à la décision basée sur les données. Le passage du HPC au HPDA (High Performance Data Analysis) est une étape importante pour améliorer l’efficacité de l’enseignement et de la recherche scientifique, et l’autonomisation de l’IA peut aider à résoudre des problèmes qui étaient impossibles, inexacts et peu pratiques à calculer dans le passé.

À lère des grands modèles dIA, les nouvelles bases de stockage de données favorisent la transition vers lintelligence numérique de léducation et de la recherche scientifique

Lors de la Conférence mondiale sur l'intelligence artificielle 2023 qui s'est tenue récemment, le stockage distribué OceanStor Pacific de Huawei a aidé l'Université Jiao Tong de Shanghai à construire une base de stockage HPC+AI qui a été officiellement lancée. La base de données unifiée « Turn it over » sera étendue de 25 Po supplémentaires cette année. Il devrait devenir une nouvelle référence pour la transformation numérique et intelligente de l’enseignement et de la recherche scientifique, et également poser une étape importante dans l’exploration de nouvelles bases de stockage de données.

L'évolution de la relation entre données et puissance de calcul et les enjeux qui en découlent

Avec la transformation numérique de milliers d'industries qui entrent en eaux profondes et l'explosion coordonnée de technologies émergentes telles que l'intelligence artificielle et le big data, la relation entre les données et la puissance de calcul subit des changements subtils.

À lère des grands modèles dIA, les nouvelles bases de stockage de données favorisent la transition vers lintelligence numérique de léducation et de la recherche scientifique

Le domaine de l’éducation et de la recherche scientifique est à la pointe de l’économie numérique et est assez sensible à cette évolution. Autrefois, les données devaient suivre la puissance de calcul. Afin de faire face à la solution numérique rapide de problèmes scientifiques et d'ingénierie complexes, la communauté de l'éducation et de la recherche scientifique s'est depuis longtemps concentrée sur la manière de construire la puissance de calcul la plus puissante, alors que les données ne sont considérées que comme un outil de soutien pour puissance de calcul.

De nos jours, « la puissance de calcul tourne autour des données » est progressivement devenue une nouvelle tendance. L’émergence d’applications émergentes, l’expansion du volume de données et la mise en lumière des problèmes de sécurité des données ont mis davantage l’accent sur la valeur des données elles-mêmes. Basé sur les percées de l'IA, du Big Data et d'autres technologies, le calcul intensif traditionnel évolue vers un calcul intensif à forte intensité de données, et de multiples puissances de calcul hétérogènes doivent être construites autour de la même base de stockage de données.

Lin Xinhua, directeur adjoint du Centre d'information sur les réseaux de l'Université Jiao Tong de Shanghai, estime que le renversement de la domination en matière de données et de puissance de calcul offre non seulement l'opportunité de construire une plate-forme de calcul intensif à forte intensité de données, mais apporte également de nombreux nouveaux défis au monde. construction d'une base de stockage de données unifiée.

Tout d’abord, la croissance explosive des données a considérablement augmenté la demande de capacité de stockage. Selon les statistiques, l'échelle de données de la plate-forme « Jiaowosuan » a augmenté à un rythme annuel de 7 Po. Le volume de données de scénarios d'application tels que la météorologie et l'océanographie, l'exploration énergétique, la télédétection par satellite, le séquençage des gènes, la cryomicroscopie électronique, l'IA. la conduite autonome, la fabrication CAE et le rendu d'animation ont tous atteint le niveau de 7 pétaoctets, il n'est pas facile d'utiliser une infrastructure de données pour accueillir une telle quantité de données.

Deuxièmement, de nouvelles activités émergent constamment et nécessitent des performances de stockage plus élevées. L'accélération du processus de généralisation de l'IA, en particulier la production par lots de grands modèles et de multimodalités, pose de sérieux défis aux performances des IO. Alors que des centaines de téraoctets d'ensembles de données deviennent la norme, le traitement du langage naturel et les applications multimodales ont accéléré la croissance du volume de données, et un accès efficace aux petits ensembles de données de formation de fichiers nécessite des performances de stockage pour atteindre un nouveau niveau.

Troisièmement, le stockage multicluster est partagé entre les campus, et le flux de données entre des clusters hétérogènes peut entraîner des problèmes tels qu'une perte de données et un fonctionnement lent. La plate-forme « Jiaowosuan » offre une variété de puissance de calcul hétérogène, notamment des clusters ARM, des clusters X86 et des clusters IA. Parmi de nombreux clusters, ce n'est qu'en réalisant un flux de données complet et une intégration complète des données que la valeur maximale de la puissance de calcul et des données peut être libérée.

Enfin, avec la formation traditionnelle des disques locaux de l'IA, ainsi que l'analyse des données à haute concurrence, il est urgent de briser le mur des E/S. Le goulot d'étranglement des E/S dans le processus de migration de données multiples est très important : le processus traditionnel de lecture et d'écriture est long, le chargement des données implique trois migrations de données et le point de contrôle implique également deux migrations de données. La perte d'efficacité provoquée au cours de ce processus ne peut être ignorée.

La voie révolutionnaire de la base de données intégrée unifiée de stockage distribué

Afin de relever les défis ci-dessus, l'Université Jiao Tong de Shanghai et Huawei Storage ont lancé une coopération approfondie depuis 2019 pour construire conjointement une plate-forme de supercalcul à forte intensité de données « remettez-moi ». S'appuyant sur leur profonde accumulation d'innovations technologiques et applicatives, les produits de stockage distribué OceanStor Pacific de Huawei aident « Tuowo Calculation » à construire une base de données unifiée pour prendre en charge diverses plates-formes de puissance de calcul hétérogènes au sein de l'école.

À lère des grands modèles dIA, les nouvelles bases de stockage de données favorisent la transition vers lintelligence numérique de léducation et de la recherche scientifique

Construire une base de données intégrée unifiée et distribuée est le seul moyen pour « Leave It To Me » d'adopter les applications de données émergentes. Basée sur une architecture de stockage distribuée évolutive horizontalement, la capacité de stockage et la bande passante de la plateforme « Jiaowosuan » peuvent être étendues à la demande. Premièrement, la capacité de performances augmente de manière linéaire et un seul cluster peut atteindre une capacité de niveau EB ; deuxièmement, il utilise du matériel haute densité et de grande capacité pour économiser de l'espace dans l'armoire ; compression basée sur des scénarios.

Il est entendu que la plate-forme « Jiaowosuan » passera d'une capacité initiale de 2 Po et d'une bande passante de 6 Go/s à une capacité de 20 Po et une bande passante de 60 Go/s en 2020, et sera étendue à une capacité de 40 Po et une bande passante de 120 Go/s en 2022. son lancement est prévu en 2023. La capacité sera augmentée de 25 Po supplémentaires. Dans le même temps, le stockage distribué OceanStor Pacific de Huawei présente une conception ultra haute densité de 5U et 120 emplacements de disque, combiné à un algorithme de protection contre la redondance des données EC à grande échelle, il peut augmenter l'utilisation de l'espace du disque dur à 91,6 % tout en respectant les normes. haute fiabilité.

La prise en charge matérielle 100 % Flash distribuée est la pierre angulaire du « laissez-moi faire » pour résoudre les problèmes de performances de stockage. Avec l'aide de Huawei OceanStor Pacific, la plate-forme « Turn it over » utilise l'accélération matérielle 100 % Flash pour améliorer considérablement la bande passante et les performances IOPS. Chaque nœud dispose de 800 000 IOPS et d'une bande passante de 20 Go/s, ce qui peut répondre aux exigences de hautes performances. conditions de charge mixtes.

La gestion unifiée du stockage distribué mondial sur les campus est un bon moyen de résoudre le problème du partage de stockage multicluster. En utilisant le système de fichiers global pour gérer plusieurs ensembles de stockage sur plusieurs domaines, la plate-forme « Jiaowosuan » crée une base de données unifiée sur tous les campus. Avec la prise en charge des produits de stockage distribué OceanStor Pacific de Huawei, elle permet d'obtenir des vues globales de fichiers, une gestion et une planification des données. flux de données global, métadonnées de streaming unifiées et autres objectifs multiples.

L'accélération de l'analyse des données, l'interopérabilité sans perte d'accès multiprotocole et la haute efficacité sans délocalisation sont les outils puissants qui permettent de « me laisser faire » pour briser le mur des E/S. Basée sur la solution de stockage orientée IA de Huawei et sur la capacité de stockage distribué OceanStor Pacific de Huawei de « une donnée, accès via plusieurs protocoles », la plate-forme « Turn it over » réalise un stockage externe pour réduire la relocalisation des données, améliore considérablement l'efficacité de l'analyse et économise le stockage. espace.

L'image future de HPDA+AI à l'ère des grands modèles

Grâce à la plate-forme « Jiaowosuan » et à la trajectoire d'évolution de la collaboration avec Huawei Storage pour créer une nouvelle base de données intégrée unifiée et distribuée, il n'est pas difficile de voir que les scénarios à forte intensité de données accélèrent leur évolution.

Des premiers HPC aux HPDA ultérieurs, puis à la symbiose HPDA+AI, les scénarios d'application dans l'industrie de l'enseignement et de la recherche scientifique ont continué à s'enrichir, et la demande de produits de stockage et de bases de données a également continué d'augmenter. En fait, l’enseignement et la recherche scientifique ne sont que la pointe de l’iceberg dans le processus de numérisation de milliers d’industries. L’ère du stockage de données approche.

L'arrivée de l'ère des grands modèles va remodeler davantage l'infrastructure informatique, y compris le stockage, et les produits de stockage dotés de nouveaux gènes d'IA devraient devenir les nouveaux favoris dans la mise à niveau numérique de l'industrie. Le 14 juillet, la conférence de lancement des nouveaux produits de stockage IA de Huawei à l'ère des grands modèles, sur le thème « Un nouveau paradigme de données libérant un nouvel élan pour l'IA », se tiendra en ligne. Que vous déployiez l'IA dans votre entreprise ou développiez des applications dotées de capacités d'IA, les solutions publiées cette fois fourniront une meilleure architecture technique et des produits pour vous aider à suivre le rythme.

La généralisation de l'intelligence artificielle a commencé. Le leader de l'industrie du stockage a pris les devants en lançant l'appel au clairon. Chaque mouvement qui suit mérite d'être attendu.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment construire un système de gouvernance des données orienté IA ? Comment construire un système de gouvernance des données orienté IA ? Apr 12, 2024 pm 02:31 PM

Ces dernières années, avec l'émergence de nouveaux modèles technologiques, la valorisation des scénarios d'application dans diverses industries et l'amélioration des effets produits grâce à l'accumulation de données massives, les applications de l'intelligence artificielle ont rayonné dans des domaines tels que la consommation et Internet. aux industries traditionnelles telles que l’industrie manufacturière, l’énergie et l’électricité. La maturité de la technologie de l'intelligence artificielle et son application dans les entreprises de divers secteurs dans les principaux maillons des activités de production économique telles que la conception, l'approvisionnement, la production, la gestion et les ventes s'améliorent constamment, accélérant la mise en œuvre et la couverture de l'intelligence artificielle dans tous les maillons, et l'intégrer progressivement à l'activité principale, afin d'améliorer le statut industriel ou d'optimiser l'efficacité opérationnelle, et d'étendre davantage ses propres avantages. La mise en œuvre à grande échelle d'applications innovantes de la technologie de l'intelligence artificielle a favorisé le développement vigoureux du marché de l'intelligence Big Data et a également injecté une vitalité au marché dans les services sous-jacents de gouvernance des données. Avec le big data, le cloud computing et l'informatique

Pourquoi le stockage local ne parvient-il pas à sauvegarder les données ? Pourquoi le stockage local ne parvient-il pas à sauvegarder les données ? Jan 03, 2024 pm 01:41 PM

Pourquoi le stockage des données sur le stockage local échoue-t-il toujours ? Besoin d'exemples de code spécifiques Dans le développement front-end, nous avons souvent besoin de stocker des données côté navigateur pour améliorer l'expérience utilisateur et faciliter l'accès ultérieur aux données. Localstorage est une technologie fournie par HTML5 pour le stockage de données côté client. Elle fournit un moyen simple de stocker des données et de maintenir la persistance des données après l'actualisation ou la fermeture de la page. Cependant, lorsque nous utilisons le stockage local pour le stockage de données, parfois

Comment implémenter les fonctions de stockage d'images et de traitement des données dans MongoDB Comment implémenter les fonctions de stockage d'images et de traitement des données dans MongoDB Sep 22, 2023 am 10:30 AM

Aperçu de la façon d'implémenter les fonctions de stockage d'images et de traitement des données dans MongoDB : dans le développement d'applications de données modernes, le traitement et le stockage d'images sont une exigence courante. MongoDB, une base de données NoSQL populaire, fournit des fonctionnalités et des outils qui permettent aux développeurs d'implémenter le stockage et le traitement d'images sur sa plateforme. Cet article présentera comment implémenter les fonctions de stockage d'images et de traitement des données dans MongoDB, et fournira des exemples de code spécifiques. Stockage d'images : dans MongoDB, vous pouvez utiliser GridFS

Comment implémenter le stockage polymorphe et l'interrogation multidimensionnelle des données dans MySQL ? Comment implémenter le stockage polymorphe et l'interrogation multidimensionnelle des données dans MySQL ? Jul 31, 2023 pm 09:12 PM

Comment implémenter le stockage polymorphe et l'interrogation multidimensionnelle des données dans MySQL ? Dans le développement d'applications pratiques, le stockage polymorphe et l'interrogation multidimensionnelle des données sont une exigence très courante. En tant que système de gestion de bases de données relationnelles couramment utilisé, MySQL offre diverses façons d'implémenter le stockage polymorphe et les requêtes multidimensionnelles. Cet article présentera la méthode d'utilisation de MySQL pour implémenter le stockage polymorphe et l'interrogation multidimensionnelle des données, et fournira des exemples de code correspondants pour aider les lecteurs à les comprendre et à les utiliser rapidement. 1. Stockage polymorphe Le stockage polymorphe fait référence à la technologie permettant de stocker différents types de données dans le même champ.

Interaction entre Redis et Golang : comment obtenir un stockage et une récupération rapides des données Interaction entre Redis et Golang : comment obtenir un stockage et une récupération rapides des données Jul 30, 2023 pm 05:18 PM

Interaction entre Redis et Golang : Comment obtenir un stockage et une récupération rapides des données Introduction : Avec le développement rapide d'Internet, le stockage et la récupération des données sont devenus des besoins importants dans divers domaines d'application. Dans ce contexte, Redis est devenu un middleware de stockage de données important, et Golang est devenu le choix de plus en plus de développeurs en raison de ses performances efficaces et de sa simplicité d'utilisation. Cet article présentera aux lecteurs comment interagir avec Golang via Redis pour obtenir un stockage et une récupération rapides des données. 1.Re

Quel type de fichier est un fichier DAT ? Quel type de fichier est un fichier DAT ? Feb 19, 2024 am 11:32 AM

Le fichier dat est un format de fichier de données universel qui peut être utilisé pour stocker différents types de données. Les fichiers dat peuvent contenir différentes formes de données telles que du texte, des images, de l'audio et de la vidéo. Il est largement utilisé dans de nombreuses applications et systèmes d’exploitation différents. Les fichiers dat sont généralement des fichiers binaires qui stockent les données en octets plutôt qu'en texte. Cela signifie que les fichiers DAT ne peuvent pas être modifiés ni leur contenu visualisé directement via un éditeur de texte. Au lieu de cela, des logiciels ou des outils spécifiques sont nécessaires pour traiter et analyser les données des fichiers DAT. d

À l'ère des grands modèles d'IA, les nouvelles bases de stockage de données favorisent la transition vers l'intelligence numérique de l'éducation et de la recherche scientifique À l'ère des grands modèles d'IA, les nouvelles bases de stockage de données favorisent la transition vers l'intelligence numérique de l'éducation et de la recherche scientifique Jul 21, 2023 pm 09:53 PM

L'IA générative (AIGC) a ouvert une nouvelle ère d'intelligence artificielle générale. La concurrence autour des grands modèles est devenue spectaculaire. L'infrastructure informatique est le principal objectif de la concurrence, et la prise de pouvoir devient de plus en plus un consensus industriel. Dans la nouvelle ère, les grands modèles passent d'une modalité unique à une multimodalité, la taille des paramètres et des ensembles de données d'entraînement augmente de façon exponentielle et les données massives non structurées nécessitent en même temps la prise en charge de capacités de charge mixtes hautes performances ; gourmand en données Le nouveau paradigme gagne en popularité et les scénarios d'application tels que le calcul intensif et le calcul haute performance (HPC) évoluent en profondeur. Les bases de stockage de données existantes ne sont plus en mesure de répondre aux besoins en constante évolution. Si la puissance de calcul, les algorithmes et les données constituent la « troïka » qui conduit le développement de l'intelligence artificielle, alors dans le contexte d'énormes changements dans l'environnement externe, les trois doivent de toute urgence retrouver un dynamisme

Comment utiliser C++ pour une compression et un stockage de données efficaces ? Comment utiliser C++ pour une compression et un stockage de données efficaces ? Aug 25, 2023 am 10:24 AM

Comment utiliser C++ pour une compression et un stockage de données efficaces ? Introduction : À mesure que la quantité de données augmente, la compression et le stockage des données deviennent de plus en plus importants. En C++, il existe de nombreuses façons d’obtenir une compression et un stockage efficaces des données. Cet article présentera certains algorithmes de compression de données et technologies de stockage de données courants en C++, et fournira des exemples de code correspondants. 1. Algorithme de compression de données 1.1 Algorithme de compression basé sur le codage de Huffman Le codage de Huffman est un algorithme de compression de données basé sur un codage de longueur variable. Pour ce faire, il associe des caractères avec une fréquence plus élevée

See all articles