生成 AI の庭で、NVIDIA が「ディガー」としてどのように機能するか-AI-php.cn

生成式AI的花园里英伟达如何做“挖掘工”

NVIDIA GPU はなぜ高価なのでしょうか?

著者: 江月

編集者:タオ・リー・ルー・タオラン

画像出典: 画像昆虫

「CPU 拡張の時代は終わった」とは、Nvidia の創設者兼 CEO の Jen-Hsun Huang 氏が、5 月 29 日に開催された台北国際コンピューターショーで発表した言葉です。「2 時間に及んだ講演の中で、彼は、生成 AI によってもたらされる「トリガーポイント」を中心に、Nvidia の最近のハードウェア、ソフトウェア、および新しいシステム製品を徹底的に紹介しました。

Huang Renxun 氏は、GPU によって形成された「新しいコンピューター」が登場したと述べました。 Nvidiaが開発した新しい「コンピュータ」はこれまでとは形が異なり、単体の販売価格は最大20万ドルに達する。「高価」論争のさなか、Huang Renxun 氏はまた、電力予算が限られているすべての企業にとって

GPU が唯一の選択肢であり、最も「節約」できるインフラストラクチャオプションでもあると述べました。

黄仁勲氏は最近、AI時代を前にして人々は「ゆっくり歩くのではなく走る」必要があると演説で述べた。生成 AI の庭で、Nvidia は明らかに熱心に取り組んでいます。

GPU データのデコード心臓コスト

「GPU データセンターは高いとみんながいつも言います。私が計算させてください。」 5 月 29 日、Nvidia の創設者兼 CEO の Huang Jen-Hun は、台北国際コンピューターショーで GPU を一般に詳しく紹介しましたデータセンターの費用。

NVIDIA は、サプライヤーや顧客との会合に新しい AI コンピューター DGX GH200 を持ち込みました。これは、256 個の Nvidia の最高性能の CPU と GPU を統合したスーパーコンピューターであり、「非常に大規模なモデル」のトレーニングニーズを満たすことができます。

DGX GH200 は、NVIDIA NVLink-C2C 相互接続テクノロジを使用して Arm ベースの Grace アーキテクチャ CPU と Hopper アーキテクチャ GPU を相互接続し、最大 900GB/s の合計帯域幅を達成します。これは、従来のアクセラレーションシステムの標準 PCIe Gen5 チャネルよりも高いです7この種のコンピューティング能力は、今日の最も要求の厳しい生成 AI および HPC アプリケーションに対応できます。

生成式AI的花园里英伟达如何做“挖掘工”

写真は、NVIDIA が 5 月 29 日に発表したスーパーチップ GH200 Grace Hopper です。

写真提供：NVIDIA

データセンターインフラストラクチャに対する市場の需要が高まるにつれ、Nvidia も市場に対して何らかの「販売方法」を使用する必要があります。最も急務なのは、機器が「高価である」という人々の不安を解消することだ。

簡単に言うと、「GPU データセンターを使用すると、150 倍のパフォーマンスが得られ、コストの 2/3 を節約できます。」と Huang Renxun 氏は言いました。

Huang Renxun 氏は、例として同じ 1,000 万ドルの予算を使用して、AIGC 開発者は 960 個の CPU サーバーで構成されるデータセンターを構築できます。これは大規模な言語モデルをトレーニングするのに十分で、最終的な動作消費量は 11 ギガワットであると紹介しました。 . 電力時間 (GWh、1,100 万キロワット時の電力に相当)。

しかし、GPU に切り替えると、48 台の GPU サーバーで構成されるデータセンターを構築できます。ただし、このデータセンターは 44 個の大規模な言語モデルをトレーニングでき、合計 3.2 ギガワット時 (320 万キロワット時の電力に相当) を消費します。）。

上記の計算方法によれば、チップ単体の価格に基づくと、GPUチップの価格はCPUの20倍となり、「割高」と思われます。

ただし、データセンターの TCO コスト計算方法によれば、GPU データセンターの方が「コストを節約できる」とされています。

Huang Renxun は、デモ PPT に直接公式を列挙しました: データセンターの保有コスト = f {ハードウェアコスト (チップ、システム、ハードウェアエコシステム)、スループット (GPU、AIgo ソフトウェア、ネットワーク、システムソフトウェア、ソフトウェアエコシステム)、使用量（AIgo Lib、ソフトウェアエコシステム）、調達業務、ライフサイクルの最適化、コンピューティングパワー} というように、データセンターの TCO コストの問題を説明しています。

「なぜこれが重要なのでしょうか？現実には、ほとんどの企業には電力制限があるからです。」 Huang Renxun 氏は再度強調しました。 AIGC に投資する場合、企業はこの客観的な要素を考慮して、より効率的で消費電力の低いデータセンター製品を選択する必要があります。

データセンターで GPU が非常に強力なのはなぜですか? Huang Renxun 氏によると、これは主に 3 つの主要な機能によるものです。

レイトレーシング (光の特性をシミュレート)、テンソルコンピューティングを核とした人工知能、および新しいアルゴリズムです。

2017 年以降、NVIDIA はこれら 3 つの機能を GPU 上で同時に実装し始め、画像生成に GPU を使用することが初めて市場を驚かせました。当時、CPU サーバーを使用して何もないところから画像を「作成」するには数時間かかりましたが (このプロセスは専門用語で「レンダリング」と呼ばれます)、Nvidia は GPU を使用してわずか 15 秒しかかかりませんでした。

ただし、新しい GPU コンピューターのいわゆる「安さ」は、消費者市場をターゲットにしたものではありません。現在、パソコン市場では CPU コア PC やノート PC の方が安価であるため、代替することができません。

Huang Renxun 氏は講演の中で、8 個の H100 チップで構成された新しい GPU コンピューターを紹介しました。「これは世界で最も高価なコンピューターだ」と黄仁勲氏は語った。

この新しいコンピューターの重量は 65 ポンド (約 29.5 キログラム) で、スムーズかつ正確に設置するにはロボットの助けが必要です。「このコンピュータは20万ドルで販売されています」と黄仁勲氏は語った。

AIGC 業界の変革を始めましょう

これは再書き込みです: AIGC のリーダーの地位を獲得するための NVIDIA の最初のステップは、ハードウェアを使用して「CPU 時代」を排除することです。現在、NVIDIA はソフトウェアエコシステムにおける計画を慎重に策定しており、CUDA コンピューティングモデルを 400 万人のソフトウェア開発者に推進することに加えて、ゲーム AI モデルの OEM サービスも開始し、製造業界に深く入り込んで仮想化をサポートしています。工場とロボットのシミュレーション、テクノロジーと自動検出。

「なぜ人々は何年もの間、新しいコンピューティング手法を開発できなかったのでしょうか?」黄仁勲氏は CPU の時代について語った。これは、ハードウェアとソフトウェア、消費者市場、開発者とサプライヤーの間には「鶏が先か、卵が先か」の関係があり、それが相互抑制につながり、CPU ベースのコンピューティング手法の継続を可能にしているためであると彼は指摘しました。偶数、長い。

したがって、「CPU 時代」の束縛を打ち破るために、Nvidia はチップのハードウェアを精力的に設計するだけでなく、ソフトウェアのエコロジー環境の構築にも細心の注意を払っています。 CUDA コンピューティングモデルは、NVIDIA がこの長期的なレイアウトのために作成した重要な部分です。

現在、3,000 を超えるアプリケーションと 400 万人の開発者が NVIDIA Cuda コンピューティングモデルを使用しています。昨年だけで、Cuda は 2,500 万回ダウンロードされ、総ダウンロード数は 4,000 万回に達しました。 Huang Renxun 氏は、このような大規模なソフトウェアをベースにした CPU を GPU が置き換えることは可能であると指摘しました。

Huang Renxun 氏の 2 時間の講演を要約すると、コアスーパーチップ、相互接続技術、アルゴリズムエンジンの最適化、ソフトウェアアップグレードのサポートなど、NVIDIA の AIGC 分野の探求がわかります。

実際には、AIGC に含まれるテキスト、テキスト、画像、2D 画像、および 3D 画像は、NVIDIA の対話型 AI モデルオープンソースフレームワーク NeMo や Meta の大型モデル LLaMa など、さまざまな大規模なモデルまたはアプリケーションを通じて実装されています。 GPTモデルを利用したChatGPTアプリケーション、VincentグラフアプリケーションStable Diffusionなど。

現在、世界で最も影響力のある AIGC テクノロジリーダーは、NVIDIA が提供するツールを徹底的に活用しており、これにより NVIDIA は米国株式市場で時価総額が「1 兆米ドル」のピークに達することにもなりました。 Apple、Microsoft、Google、Amazon と競合する企業は、一緒に「兆クラブ」に入っています。

今回 Nvidia が AIGC 業界にもたらしたツールの数は市場を驚かせました。上記の製品に加えて、大規模なゲーム制作やデジタルファクトリーへの NVIDIA の関与も非常に目を引きます。

ゲーム制作に関しては、Huang Renxun 氏がゲームクリップを披露しました。このクリップでは、リアルな映像演出に加え、ゲームプレイヤーとNPCとの会話も完全にAIGCが生成しています。言い換えれば、将来のゲームは「何千もの顔」を持つことができ、プレイヤーはパターン化された応答しか返さない NPC と対峙することはなくなります。 ACE Game Development Edition は、NVIDIA が提供する AI モデルファウンドリサービスで、ゲーム開発者がこの機能を簡単に使用できるようにします。

NVIDIA はまた、一部の大手電子機器メーカーが NVIDIA の AIGC およびオムニバースプラットフォームを使用して工場の「デジタル化」を実現していることも紹介しました。

製造業では、世界中に約 1,000 万の工場があり、産業のデジタル化の重要な分野です。

Huang Renxun 氏は次のように述べています:

「工業生産はすべて物理的な物体です。最初に製品をデジタルで製造できれば、数十億ドルを節約できます。」

現在、産業分野では、NVIDIA は主に工場の仮想工場設計を支援する Omniverse および生成 AI を開発しており、Isaac Sim シミュレーションおよびテストロボットや Metropolis 光学検査自動化ツールも発売しています。

Foxconn、Pegatron、Quanta などの電子機器メーカーは、ラップトップやスマートフォンの生産と組み立てを高速化するために、NVIDIA の上記のツールをすでに使用していると考えられています。

21技術

南彩グループ特別コラム

以前の推奨事項

産業用インターネットから AIGC へ: インテリジェント製造はどのように移行するのでしょうか?

05-30

Glory CEO Zhao Ming: オンデマンドでチップ戦略を開発し、2023 年までに R&D 比率を 10% に維持する