人工知能によりデータセンターは設計の再考を余儀なくされる

WBOY
リリース: 2023-09-23 09:25:01
転載
1262 人が閲覧しました

人工知能によりデータセンターは設計の再考を余儀なくされる

人工知能が企業内でより広く使用されるようになるにつれて、その結果の 1 つは、データセンター内のワークロードのより大きな部分を人工知能が消費するようになるということです。

人工知能は、データセンターの需要を加速させ、新たな投資動機を生み出すだけでなく、データセンターの持続可能性戦略や導入するインフラストラクチャの性質にも影響を与えるでしょう。

たとえば、Tirias Research は、現状では、生成 AI データセンター サーバー インフラストラクチャと運用コストを合わせたコストが 2028 年までに 7,600 万ドルを超えると予測しており、これは現在推定されている Amazon AWS の年間運用コストの 2 倍です。 、世界のクラウド サービス市場の 3 分の 1 を占めています。

ハードウェア コンピューティング パフォーマンスは 400% 向上すると予想され、ティリアスの処理ワークロードの推定 50 倍増加をはるかに上回る

高密度

シュナイダー エレクトリックによると、大規模なトレーニング クラスターと新しいホワイトペーパーによると、小型のエッジ推論サーバーは、より高いラック電力密度への移行も意味します。

ホワイトペーパーには次のように記載されています:「人工知能の新興企業、企業、コロケーションプロバイダー、およびインターネット大手は、データセンターの物理インフラストラクチャの設計と管理に対するこれらの密度の影響を考慮する必要があります。」

Schneiderエネルギー管理研究センターは、人工知能がエネルギー需要に与える影響を予測しています。推定によると、AI は現在 4.3GW の電力需要に相当し、2028 年までに 26% ~ 36% の CAGR で成長すると予想されています。

これにより、総需要は 13.5GW ~ 20GW に達するとのデータです。センター全体の電力需要の伸びは 3 倍に達します。 2028 年までに、AI ワークロードはデータセンターの総エネルギーの 20% を占めるようになるでしょう

Schneider 氏は、AI ワークロードはトレーニング クラスターよりも多くの電力を消費すると予想されますが、推論ワークロードはさまざまなラック密度で実行できると述べました。

「一方、AI トレーニングのワークロードは、ラックあたり 20 ~ 100 kW 以上の非常に高密度で実行されています。」

ネットワーク要件とコストが、これらのトレーニングのきっかけとなったラックが組み合わされます。これらの高電力密度クラスターは、データセンターの電力、冷却、ラック、およびソフトウェア管理設計に根本的な課題をもたらします

電力システムの課題

シュナイダー氏は、影響が考えられる 4 つの主要領域について概説しています。電力、冷却、ラックとソフトウェアの管理

電力面では、AI ワークロードが開閉装置や配電システムの電力システムに課題をもたらします。

現在使用されている一部の電圧は導入が非現実的であることが判明し、配電ブロック サイズが小さいと IT スペースが無駄になる可能性があります。ラックの温度が高くなると、故障や危険の可能性も高まります。 書き換えられた内容: 現在使用されている電圧の一部は、導入時に実用的ではないことが判明する可能性があり、配電ブロック サイズが小さいと IT スペースを無駄にする可能性があります。同時に、ラックの温度が高くなると、障害や危険の可能性も高まります。

データセンターが液体冷却に移行するにつれて、冷却が重要になり、大幅な変更が必要となる分野の 1 つである液体冷却が使用されています。半世紀以上にわたり、プロフェッショナル向けハイパフォーマンス コンピューティングの分野で活躍してきました。

シュナイダー氏は、「空冷は近い将来もまだ存在するだろうが、空冷から液冷への移行は、人工知能クラスターを備えたデータセンターにとって好ましい、あるいは必要なソリューションになると予測される」と述べた。 言い換え: シュナイダー氏によると、近い将来には空冷が依然として存在するものの、人工知能クラスターを備えたデータセンターでは空冷から液冷への移行が推奨または必要なソリューションになることが予測されています

Liquid冷却には空冷と比較して多くの利点があります。まず、液体冷却によりプロセッサーの信頼性とパフォーマンスが向上します。次に、液体冷却によりスペースが節約され、ラック密度が向上します。さらに、液体冷却中の水は熱慣性が大きいため、水の消費量を削減できます。

人工知能クラスターの場合、サーバーはより深くする必要があり、電力要件がより大きくなり、冷却はより複雑になります。

需要を満たすには、ラックの密度と耐荷重能力を高める必要があります

デジタル ツイン

最終的には、DCIM、BMS、電気設計ツールなどのソフトウェア ツールが管理人工知能クラスターの鍵

ソフトウェアの適切な構成と実装により、電力制約と冷却リソースのパフォーマンスを特定し、最適なレイアウト決定のための関連情報を提供するデータセンターのデジタルツインを実現できます

ますます動的になる環境では、エラーの許容範囲が小さくなるほど、運用リスクが高くなります。したがって、シュナイダー氏は、ラック内の機器や仮想マシンを含む IT スペース全体のデジタル ツインを作成することを推奨しています。

IT 負荷をデジタル的に追加または移動することで、それをサポートするのに十分な電力、冷却、および床の耐荷重能力があることを確認できます。これにより、リソースの滞留を回避し、ダウンタイムにつながる可能性のある人的エラーを最小限に抑えるための決定が行われます。

以上が人工知能によりデータセンターは設計の再考を余儀なくされるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート