Alors que les dépenses mondiales en systèmes d’IA devraient doubler entre 2023 et 2026, il est clair que la capacité des centres de données augmentera rapidement pour répondre à la demande.
Étonnamment, cependant, de nombreux opérateurs de centres de données ont freiné leurs nouveaux projets et ralenti leurs investissements au cours de l’année écoulée, la capacité vacante à Londres ayant chuté de 6,3 % en 2022-2023.
Quelle est la raison de cette tendance contre-intuitive ? Pour expliquer cela, nous devons comprendre certains des problèmes liés à l'informatique IA et à l'infrastructure qui la prend en charge
Les centres de données ont toujours été construits autour de la puissance du processeur pour faire face à la charge de travail informatique traditionnelle. Cependant, l'informatique IA nécessite un rack piloté par GPU, qui consomme plus d'énergie, dissipe plus de chaleur et prend plus de place qu'un processeur de même capacité.
En pratique, cela signifie une puissance de calcul IA. Souvent plus de connexions électriques ou de systèmes de refroidissement alternatifs. sont nécessaires. Peut être reformulé comme suit : Cela signifie essentiellement que la puissance de calcul de l'IA nécessite généralement davantage de connexions électriques ou de systèmes de refroidissement alternatifs.
Puisqu'il s'agit d'une infrastructure intégrée, elle est intégrée à la structure du complexe du centre de données, même si ce n'est pas entièrement impossible financièrement. les coûts de remplacement ont tendance à être extrêmement élevés.
En pratique, les opérateurs doivent s'engager sur la quantité d'espace dans un nouveau centre de données dédié à l'IA par rapport à l'informatique traditionnelle.
Commettre cette erreur et s'investir trop dans l'IA pourrait laisser les opérateurs de centres de données confrontés à des capacités sous-utilisées et non rentables en permanence
Ce problème est exacerbé. par le fait que le marché de l'IA en est encore à ses balbutiements, Gartner affirmant qu'il se trouve actuellement au sommet des attentes surattendues du cycle de battage médiatique. En conséquence, de nombreux opérateurs choisissent d’hésiter dès la phase de conception plutôt que de s’engager prématurément sur la proportion d’IA informatique dans les nouveaux projets de datacenters.
Cependant, les opérateurs sont parfaitement conscients que s'ils ne prennent pas le risque de retarder les investissements, ils perdront des parts de marché et un avantage concurrentiel. Cependant, c'est un défi de taille étant donné que bon nombre des principes fondamentaux de l'infrastructure des centres de données sont réécrits en temps réel
Pour équilibrer les besoins des premiers arrivants et compenser les risques, les opérateurs doivent concevoir leurs centres de données pour qu'ils soient résilients à l'ère de Calcul IA Efficacité et flexibilité maximales. Cela nécessite une nouvelle approche holistique du design.
Quelle que soit la manière dont les opérateurs décident de faire la différence entre l'intelligence artificielle et l'informatique traditionnelle, les sites de centres de données dotés de capacités informatiques d'intelligence artificielle seront beaucoup plus complexes que les installations traditionnelles. Une complexité plus élevée signifie souvent plus de points de défaillance, d’autant plus que l’informatique IA a plus d’exigences que l’informatique traditionnelle.
Ainsi, pour garantir la disponibilité tout au long de la vie du site et réduire le risque de problèmes coûteux, les équipes doivent être plus minutieuses dans la phase de planification du centre de données.
En particulier, la phase de conception devrait solliciter la contribution d'un plus grand nombre d'équipes et d'expertises au début du projet. En plus de rechercher une expertise en matière d'alimentation et de refroidissement, les concepteurs doivent travailler très tôt avec les équipes d'exploitation, de câblage et de sécurité pour comprendre les goulots d'étranglement potentiels ou les sources de pannes
En tant qu'opérateurs, l'IA est désormais disponible Dans ce domaine, ils devraient exploiter leurs capacités pour tirer parti de l’IA afin d’améliorer l’efficacité opérationnelle. L'intelligence artificielle est adoptée depuis longtemps dans les centres de données, la technologie étant capable d'exécuter des flux de travail avec une précision et une qualité extrêmement élevées. Par exemple, l'IA peut aider à :
En l'utilisant de manière proactive à chaque étape du cycle de vie du centre de données technologie, les opérateurs peuvent améliorer considérablement l’efficacité opérationnelle et la robustesse. L'intelligence artificielle est bien adaptée pour aider à résoudre les nouveaux défis rencontrés lors de l'adoption de l'agencement nouveau et complexe de ces centres de données de nouvelle génération, par exemple grâce à la détection des pannes et à la maintenance prédictive
Pendant les heures de pointe, l'IA. Les hubs de données imposeront une charge plus importante, par exemple lors des cycles de formation ou lors de l'exécution de modèles au niveau de l'entreprise en production. À ce stade, l'informatique IA dépassera souvent de loin les limites traditionnellement attendues en matière de consommation d'énergie, de besoins de refroidissement et de débit de données.
Au niveau le plus élémentaire, cela signifie que les matériaux sous-jacents du centre de données sont soumis à de plus grandes contraintes. Si ces matériaux ou composants sous-jacents ne sont pas de haute qualité, cela signifie qu’ils sont plus susceptibles de tomber en panne. Étant donné que l'informatique IA signifie une augmentation spectaculaire du nombre de composants et de connexions dans un site, cela signifie que des matériaux moins chers et de moindre qualité qui fonctionnent bien dans les sites traditionnels peuvent entraîner l'arrêt du centre de données exécutant l'informatique IA
À éviter Pour économiser de l'argent sur de faux risques économiques, les opérateurs doivent éviter d'acheter des matériaux de qualité inférieure, tels que des câbles de qualité inférieure. Ces matériaux sont sujets aux pannes et nécessitent un remplacement fréquent. Plus grave encore, la défaillance de matériaux et de composants de qualité inférieure entraîne souvent des arrêts ou des ralentissements d'usine, ce qui a un impact sur la rentabilité
Bien que les exigences d'infrastructure pour l'informatique IA puissent être la principale raison pour laquelle les opérateurs retardent les investissements, à long terme, ce ne sera pas le cas
À mesure que l'incertitude du marché augmente, les entreprises se diviseront entre l'informatique traditionnelle et l'intelligence artificielle. , se rapprochant de leurs « champs d'or »
Dans ce cas, les entreprises doivent s'assurer qu'elles disposent de tous les avantages possibles dans l'exploitation de leur site Web afin de réussir dans le processus d'apprentissage et de croissance
Cela signifie concevoir de manière holistique dès le départ, en tirant parti de l'IA lui-même pour découvrir de nouvelles efficacités pour ses sites et investir dans des matériaux de qualité capables de répondre aux exigences accrues de l'informatique IA.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!