Der groß angelegte Einsatz künstlicher Intelligenz in Unternehmen hat unter anderem zur Folge, dass sie einen größeren Teil der Arbeitslast in Rechenzentren beansprucht.
KI wird nicht nur die Nachfrage nach Rechenzentren beschleunigen und neue Investitionsanreize schaffen, sondern auch Auswirkungen auf Nachhaltigkeitsstrategien für Rechenzentren und die Art der bereitzustellenden Infrastruktur haben.
Zum Beispiel prognostiziert Tirias Research, dass nach derzeitigem Stand die Serverinfrastruktur für generative KI-Rechenzentren plus Betriebskosten bis 2028 76 Millionen US-Dollar übersteigen wird, was mehr als dem Doppelten der derzeit geschätzten jährlichen Betriebskosten von Amazon AWS entspricht und ein Drittel der weltweiten Kosten ausmacht Markt für Cloud-Dienste.
Es wird erwartet, dass die Hardware-Rechenleistung um 400 % steigt, was Tirias’ geschätzten 50-fachen Anstieg der Verarbeitungslasten in den Schatten stellt wird auch eine Umstellung auf eine höhere Rack-Leistungsdichte bedeuten.
Schneider Energy Management Research Center über die Auswirkungen künstlicher Intelligenz Informationen zu Die Auswirkungen auf den Energiebedarf werden vorhergesagt. Schätzungen zufolge stellt KI derzeit einen Strombedarf von 4,3 GW dar und wird voraussichtlich bis 2028 mit einer jährlichen Wachstumsrate von 26 % bis 36 % wachsen. Dies wird zu einem Gesamtbedarf von 13,5 GW bis 20 GW führen, was der gesamten Rechenzentrumsleistung entspricht Nachfrage Zwei- bis dreifaches Wachstum. Bis 2028 werden KI-Workloads 20 % der gesamten Rechenzentrumsenergie ausmachen
Schneider wies darauf hin, dass sie zwar voraussichtlich mehr Strom verbrauchen als Trainingscluster, Inferenz-Workloads jedoch bei verschiedenen Rackdichten ausgeführt werden können.
„KI-Trainings-Workloads hingegen liefen in sehr hoher Dichte, mit 20–100 kW oder mehr pro Rack.“
Netzwerkanforderungen und Kosten sind der Grund dafür, dass diese Trainings-Racks zusammengefasst werden zusammen sein. Diese Cluster mit hoher Leistungsdichte stellen grundlegende Herausforderungen für das Design von Stromversorgung, Kühlung, Rack- und Softwaremanagement im Rechenzentrum dar.
Herausforderungen für das Stromversorgungssystem
Schneider skizziert vier Schlüsselbereiche, die Auswirkungen haben können: Stromversorgung, Kühlung, Rack- und Softwaremanagement
Im Energiebereich stellen KI-Arbeitslasten die Stromversorgungssysteme in Schaltanlagen und Verteilungssystemen vor Herausforderungen.
Mit der Umstellung von Rechenzentren auf Flüssigkeitskühlung wird die Kühlung von entscheidender Bedeutung sein und einer der Bereiche sein, in denen wesentliche Änderungen erforderlich sind, da mehr als die Hälfte bereits Flüssigkeitskühlung verwendet im professionellen Hochleistungsrechnen seit Jahrhunderten.
Schneider sagte: „Obwohl es in naher Zukunft noch Luftkühlung geben wird, wird vorhergesagt, dass der Übergang von Luftkühlung zu Flüssigkeitskühlung die bevorzugte oder notwendige Lösung für Rechenzentren mit Clustern künstlicher Intelligenz sein wird.“ Umformuliert: Laut Schneider wird es in naher Zukunft zwar noch Luftkühlung geben, Prognosen deuten jedoch darauf hin, dass die Umstellung von Luftkühlung auf Flüssigkeitskühlung die bevorzugte oder notwendige Lösung für Rechenzentren mit KI-Clustern sein wird
vs. Luft. Flüssigkeitskühlung hat viele Vorteile gegenüber der Kühlung. Erstens verbessert die Flüssigkeitskühlung die Zuverlässigkeit und Leistung des Prozessors. Zweitens spart die Flüssigkeitskühlung Platz und erhöht die Rackdichte. Darüber hinaus weist das Wasser in der Flüssigkeitskühlung eine größere thermische Trägheit auf und kann den Wasserverbrauch senken
Für Cluster mit künstlicher Intelligenz müssen die Server tiefer sein, der Strombedarf ist höher und die Kühlung ist komplexer.
Um der Nachfrage gerecht zu werden, müssen Racks eine höhere Dichte und Tragfähigkeit aufweisen.
Digitale Zwillinge Dadurch kann ein digitaler Zwilling eines Rechenzentrums Energieeinschränkungen und die Leistung von Kühlressourcen identifizieren und relevante Informationen für optimale Layoutentscheidungen bereitstellen.
In einer zunehmend dynamischen Umgebung ist das Betriebsrisiko umso höher, je geringer die Fehlerquote ist. Schneider empfiehlt daher die Erstellung eines digitalen Zwillings des gesamten IT-Bereichs, einschließlich der Geräte in Racks und virtuellen Maschinen.
Durch das digitale Hinzufügen oder Verschieben von IT-Lasten können Sie überprüfen, ob ausreichend Strom, Kühlung und Bodentragfähigkeit vorhanden sind, um diese zu unterstützen. Dadurch können Entscheidungen getroffen werden, um ungenutzte Ressourcen zu vermeiden und menschliche Fehler zu minimieren, die zu Ausfallzeiten führen können
Das obige ist der detaillierte Inhalt vonKünstliche Intelligenz zwingt Rechenzentren dazu, Design zu überdenken. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!