ChatGPT をトレーニングするために、Microsoft は十分な資金を費やしました。
ChatGPT が消費する総計算能力は、1 秒あたり 1 京回計算すると、約 3640PF 日かかります。
Microsoft は、30,000 個を超える Nvidia A100 チップを接続し、数億ドルをかけて OpenAI 用にオーダーメイドのスーパーコンピューターを構築しました。
この消費が続くと、Microsoft の財布が耐えられなくなる可能性があります。
実は、Nvidiaチップの置き換え計画は2019年から社内で秘密裏に進められてきました。
The Information は、約 5 年前に Microsoft が社内コードネーム「Athena」というチップの開発を開始し、300 名が共同開発したと報じました。
当初の計画ではTSMCの5nmプロセスを使用する予定でした。
言うまでもなく、「Athena」は大規模言語モデル (LLM) のトレーニング用に特別に設計されています。
さて、Microsoft が GPT-4 のすべての機能を Bing、Microsoft 365、GitHub を含む FamilyMart バケットに組み込みたい場合は、間違いなく大量のコンピューティング能力サポートが必要になります。
驚くべきことに、Athena のようなチップの開発コストは年間約 1 億ドルかかる可能性があります。
モデルをトレーニングする際、研究者は「Athena」の機能を使用して、新しいデータを処理し、同時に推論を実行できます。
このようにして、人工知能ソフトウェアを処理するために専用のコンピューターを使用しなければならないという以前の状況は緩和されました。結局のところ、AI を実行するためだけに使用されるコンピューターだけでは決して十分ではありませんでした。
なぜなら、以前は NVIDIA だけがこの種のチップを生産していたため、供給不足によりテクノロジー業界全体がこの不足を感じているからです。
まさにこのため、Microsoft は一部の社内チームに専用チップを提供しなければなりません。
以前、調査会社セミアナリシスは、ChatGPTが1日当たり70万米ドルを消費し、各クエリのコストは0.36セントだったと推定していた。
「Athena」が競争力がある場合、各チップのコストを1/3に削減できます。
Forrester ResearchのシニアクラウドアナリストであるTracy Woo氏は、AIの爆発的な普及により大手企業がAIに殺到しており、チップ不足はサプライヤーに圧力をかけるだけでなく、AI技術企業にも圧力をかけていると述べた。 。
Google や Amazon のような大手テクノロジー企業は、独自のチップを設計、開発するのに十分な資本を持っており、他の企業もそのペースに追いつく必要があります。
Microsoft の「Athena」について話しましょう。
実際、MicrosoftのAIチッププロジェクトのリリースのタイミングは全くの偶然であり、計画されたものではありませんでした。
今年の初めに、OpenAI と Microsoft は LLM トレーニングにおいて質的飛躍を遂げました。事情に詳しい関係者によると、ChatGPTのリリースはインターネットに爆発的な影響を与え、そのためMicrosoftは「Athena」のリリースを急ぐことになったという。
ご存知のとおり、ChatGPT には 1 億人を超えるユーザーがいます。
Microsoft は、早ければ来年にも Microsoft と OpenAI 内を含めて大規模に「Athena」を適用する可能性があると予測されています。彼らがまだ迷っているのは、Azureクラウドコンピューティングサービスの顧客に「Athena」を提供するかどうかだ。
Microsoft は、ほとんどの顧客は独自の LLM をトレーニングする必要がないため、チップのサポートは必要ないと述べています。
しかし、本当にそれを実現したいのであれば、MicrosoftはNVIDIAよりもうまくやる必要があります。結局のところ、NVIDIA のチップは 15 年間懸命に働き続けており、すべての開発者にとってベストセラーとなっています。
調査会社セミアナリシスの首席アナリストであるディラン・パテル氏は、ChatGPTの運用コストは1日あたり約70万米ドル、つまり1クエリあたり約0.36セントであると述べた。これらのコストの主な原因はサーバーであり、サーバーは高価すぎます。
しかし、OpenAIが独自に開発した「Athena」を使用し、Nvidiaに勝つことができれば、コストは3分の1に削減できます。
さらに、Microsoft は将来、Bing、Office 365、GitHub などのすべてのアプリケーションで LLM を使用したいと考えていると述べました。現在のハードウェアを導入に使用し続けると、毎年数百億ドルのコストがかかります。
さらに、Microsoft の自社開発チップには別のデータ サポートがあります。
Microsoft 幹部は、AI の作業をサポートするためにどれだけの数のグラフィックス処理ユニットが必要になるかを予測しています。この件に詳しい関係者の1人は、Nvidiaチップに完全に依存すると法外な費用がかかるだろうと語った。
マイクロソフトとNVIDIAは昨年、スーパーコンピューターを構築するための協力プロジェクトに合意したばかりだが、チップの点では「Athena」は依然としてNVIDIAの製品と競合している。
ただし、NVIDIA はこのデリケートな話題についてコメントすることを拒否しました。
以上が30,000 個の A100 は高すぎるため、Microsoft の 300 人が 5 年間秘密裏に独自の AI チップを開発しました。 TSMC 5nm、ChatGPT は約 30% 節約の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。