米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

王林
リリース: 2023-06-03 17:36:07
転載
1236 人が閲覧しました

人工知能は、技術革命と産業変革の新たなラウンドを導く戦略的テクノロジーです。複数の研究結果とデータは、米国が人工知能の基礎科学研究、技術革新、産業応用において世界をリードしていることを示しており、高度な人工知能論文、トップ学者の数、人工知能企業の数などの指標が示されています。 、投資規模はいずれも他国を上回っています。

米国政府は、人工知能技術の革新と開発を非常に重視しています。 2020 年の国家 AI イニシアチブ法によると、議会は全米科学財団 (NSF) とホワイトハウス科学技術政策局 (OSTP) に対し、2023 年 1 月に米国を研究し策定するための作業グループを結成することを要求しています。人工知能研究リソース (NAIRR) インフラストラクチャ構築ロードマップは、人工知能分野における米国の競争上の優位性を強化し、米国のすべての関係者が主要な人工知能と教育リソースを入手する機会を拡大し、米国の人工知能のイノベーションと教育をさらに推進します。経済的繁栄。

米国NAIRR建設の背景と意義

建設の背景

米国政府は、人工知能分野における自国の最先端が挑戦され、競争上の優位性が弱まる危険があると考えています。問題は主に 2 つあります。まず、人工知能の研究開発と教育リソースへの投資が不均等に配分されています。調査データによると、投資の観点から見ると、米国の民間部門からの人工知能への投資額は 2020 年から 2021 年にかけて 2 倍以上に増加しましたが、新しい人工知能企業の数は減少しており、人材の観点から見ると人口は減少しています。米国の人工知能博士課程卒業生の人種と人口の分布、性別分布、実際の人口比率は大きく異なり、それが人工知能の革新と開発を制限することになります。第二に、科学研究機関にはコンピューティングリソースとデータリソースが不足しています。コンピューティング能力の観点から見ると、最先端のコンピューティング パワー プラットフォームは業界をリードする民間機関が所有しており、科学研究機関には人工知能の研究開発をサポートするコンピューティング パワー プラットフォームが不足しています。データ リソースの観点から見ると、人工知能の主要なデータ リソースは人工知能モデルのトレーニングは民間機関と大規模なインターネットオールプラットフォームによって所有されており、米国政府はデータの公開を続けていますが、人工知能の研究にはまだ不十分です。

ワーキンググループは、十分な人工知能研究リソースの欠如が米国の人工知能イノベーションエコシステムを制限し、学術研究機関から優秀な人材が少数のリソース豊富な企業に集中することにつながると指摘しました。長期的に確立されれば、米国の競争力と競争力に影響を与えるでしょう。 18か月にわたる意見公募と議論を経て、2023年1月、作業部会は正式に建設計画を提案し、建設費と運営維持費として26億ドルを申請する予定であり、NAIRR建設工事は4期に分けて完了する予定である。 6 年以内に、次の 4 つの主要目標を達成することに重点を置きます。研究革新を促進するためのリソースを収集し、人材の多様性を強化し、基本的なリソースの能力を強化し、信頼できる人工知能の開発を促進します。

重要性

NAIRR は、人工知能の研究インフラとして、米国の研究学校、学生、非営利団体、その他の機関に公開されており、コンピューティング リソース、高品質のデータ、教育ツール、その他の基礎研究リソースを提供しています。国際競争上の優位性を強化するための重要な拠点として、米国の人工知能研究協力となることを目指しています。

生態学的構築の観点から、米国政府は NAIRR を利用して政府内の関連部門と科学研究機関を結集させ、人工知能分野での協力研究と資源構築を共同で実施し、広範な協力的な生態系を形成する予定です。 NAIRR のサービスと機能を図 1 に示します。

米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

データに関しては、NAIRR は連邦政府部門からのデータを集約し、業界のさまざまな機関とデータ サービス協力を実施します。 1 つ目は、大規模な人工知能データ リソースの集約、開発、利用を促進することであり、米国連邦機関、学術研究機関、テクノロジー大手によってオープンソース化されている大規模なデータ リソースを収集して接続し、米国最大の人工知能データ リソース サービス プラットフォーム。たとえば、米国国立衛生研究所は 36PB を超える遺伝子配列データを公開し、米国海洋大気庁は 10PB を超える気象および環境データを公開しています。 2 つ目は、人工知能のデータ管理とガバナンス能力の向上を促進することです。人工知能のデータ セットは高度に断片化されており、各データ セットは特殊なタスクと研究分野をサポートしていますが、データ アノテーションとデータ ガバナンスに関する統一基準が欠如しているため、データ管理が困難になっています。 NAIRRは、データ集約のための統一標準の確立を促進し、データ記述形式を標準化し、マルチパーティデータリソースの集約を促進します。 3つ目は、多者連携によるデータリソースの開発・活用の推進です。運営主体は人工知能データセットコミュニティを運営し、コミュニティがNAIRRが使用する貴重なデータリソースを積極的に開発、構築することを奨励します。運営主体はまた、連邦政府機関のオープンデータやサードパーティのサービスプロバイダーからのデータリソースのクエリを容易にするデータ検索サービスも提供します。

コンピューティング能力の面では、NAIRR は米国の大手人工知能コンピューティング クラウド プラットフォーム企業と提携してコンピューティング パワー プラットフォームを構築し、Google、Microsoft、Amazon などのテクノロジー巨人のクラウド プラットフォームと接続する予定です。米国自然科学財団、米国国立衛生研究所などの連邦機関向けクラウド プラットフォーム。このプラットフォームは、データ、コンピューティング能力、テストベッド、ソフトウェア ツールなどのさまざまなサービスとリソースを含む、さまざまなレベルのサービス モデルとコンテンツを大学、研究機関、学生、新興企業向けに提供します。完成後、NAIRR のコンピューティング リソースには、少なくとも 1 兆パラメータ規模の機械学習モデルのトレーニングをサポートするスーパーコンピューターに加え、クラウド コンピューティング リソース、CPU、GPU、高速ネットワークが含まれることになります。

NAIRR インフラストラクチャが確立され、安定的に運用された後は、一方では政府部門や民間機関との協力を拡大し、プラットフォーム サービスとユーザーの範囲を拡大し、成功体験を促進し続けます。このプラットフォームは、関連する標準と仕様の策定を促進し、国際交流と協力に参加し、米国とその同盟国およびパートナーのための基本プラットフォームとして機能し、共同研究とデータ共有を促進します。

アメリカNAIRR建設計画

米国は、体系的なアプローチを使用して連邦政府と民間機関を動員し、協力して学術研究のための人工知能研究リソースのインフラストラクチャを確立することを計画しています。

1 つ目は、複数の当事者が参加するプラットフォーム ガバナンス システムを計画および構築することです。 NAIRR が提案するガバナンス構造を図 2 に示します。この計画では、政府部門の多者参加によるガバナンスシステムの確立と、運営委員会、管理委員会、プロジェクト管理室、運営主体、協力を調整するための諮問委員会などの一連の責任組織の設立を推奨している。連邦政府のさまざまな省庁の代表者で構成される運営委員会を設立する。これは NAIRR の全体的な計画と戦略目標に関する国家レベルの最高意思決定機関である。この分野における国の資源投資を促進するためにさまざまな部門を代表する。人工知能の。プラットフォーム運営主体を指導・管理し、資金や関連リソースを提供するために管理委員会が設立されます。この計画では、NSF が管理委員会の責任を引き受けることが提案されています。運営委員会と連携して運営主体の日常管理・評価を行うプロジェクト管理室を設置する。米国議会は、関連するプロジェクト管理、ポータルの開発と展開、共同サポート、トレーニング、ユーザー サポートをサポートするプロジェクト管理局への資金提供を承認しました。政府部門から独立した運営組織を設立し、NAIRRの具体的な開発目標の策定、プラットフォーム構築と日常の運用管理の組織化、さまざまな人工知能研究機関のニーズを満たす透明かつ公正かつ合理的なリソース配分システムの策定を担当します。そしてユーザー。 NAIRR建設の意思決定を支援するために、多分野の専門家から構成される科学委員会、技術委員会、倫理委員会、利用者委員会が設置されています。

米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

2 つ目は、NAIRR のインフラ運営と建設に専用の資金を提供することです。建設計画では、6年間で26億米ドルの資金を申請することが提案されており、そのうち22億5,000万米ドルは、サービスプロバイダーからプラットフォームのコンピューティング能力、ソフトウェアツール、データリソースを購入するために使用され、運営組織の1日の経費は370米ドルとなる予定です。 100万米ドルが使われ、さらに3,000万米ドルがインフラ運用に使用される予定です。人工知能の研究開発に関与するすべての連邦機関は、NAIRR のプロジェクト管理に参加する必要があります。人工知能分野における連邦省庁による研究開発投資は、引き続き各省庁が単独または共同で購入および開発することができますが、NAIRR インフラストラクチャを通じて管理および提供される必要があります。

3つ目は、NAIRRインフラを段階的に構築し、必要に応じてコンピューティングリソースを拡張し、データリソースの集約を推進することです。プラットフォームの構築は、プロジェクトの開始、構築、試行運用、継続運用の4つの段階に分かれています。試験運用段階では5万人のユーザーをサポートでき、既存の連邦機関のデータと民間機関のデータを集約して利用できる。安定運用後は15万人のユーザーをサポートし、より広範なデータリソース協力コミュニティを確立する予定だ。 NAIRRは、データアグリゲーション標準の策定、データ連携開発、データ検索サービスの提供など、データ活用を促進するためのデータリソースの開発を行っていきます。

新たな状況のもとで、人工知能の基礎研究リソースを構築する重要性がますます顕著になっています。 現在、人工知能の新しいテクノロジーと新しいアプリケーションが絶えず出現しており、大規模言語モデル ChatGPT に代表される新世代の大規模人工知能モデルの研究とトレーニングには、より大規模なコンピューティング リソースとデータ リソースのサポートが必要です。そして、単一の研究開発投資は大幅に増加しました。大規模な人工知能モデルのトレーニングのためのコンピューティング パワー プラットフォームのしきい値は非常に高く、通常の機関には巨額の研究開発費や運営費を支払う余裕はありません。 OpenAI の調査によると、人工知能モデルのトレーニングに必要なコンピューティング パワーは指数関数的に増加しており、2012 年から 2018 年にかけて、AI モデルのトレーニングに消費されるコンピューティング パワーは 30 万倍に増加しました。 GPT3 のトレーニングに必要な計算能力は 3640pfsday (つまり、1PetaFLOP/s の効率が 3640 日間実行される) に達し、トレーニング費用は 1 回あたり 140 万米ドルに達すると予想されており、ChatGPT の初期投資コストは約米ドルであると見積もっている組織もあります。 8億ドル。

人工知能のデータセットに関しては、大規模な事前トレーニング済みモデルの研究開発により、トレーニングに必要なデータセットのサイズがさらに大幅に増加しており、データサイズは、昔の数百万から数千万から増加しています。過去から数億まで。大規模モデルのトレーニングで使用される現在のデータ セットは、主にインターネットから取得されており、ウィキペディア、ソーシャル ネットワーキング サイト、公的ジャーナル、書籍、論文、コードなどのデータベースが含まれます。いくつかの研究では、「トレーニング データが大規模モデルの産業化に対する最大の制約の 1 つになるだろう。より深い観点から見ると、大規模モデルには、データの収集や時間のかかるラベル付けなど、トレーニング データの観点から依然としてさまざまなガバナンスの問題が存在する」と指摘されています。・消費、労力、コストがかかり、データ品質が難しい 「ロングテール」やエッジケースをカバーするための保証やデータの多様化が不十分であり、特定のデータの取得、使用、共有におけるプライバシー保護やデータの偏りなどの問題がある外国の学者による研究では、言語データの全体的な規模は 7% の割合で増加していると考えられています。高品質の言語データの増加は、人口規模や経済発展などの要因に左右され、4 % の割合で増加しています。 %から5%。大規模な言語モデルをトレーニングするための高品質のデータは、2027 年までに「枯渇」すると予想されます。

######まとめ######

コンピューティング能力とデータ リソースは、人工知能技術研究の基本的なサポート要素です。人工知能が「ビッグ モデル」時代に突入するにつれ、コンピューティング能力とデータ能力がアルゴリズム モデルの研究とトレーニングの制限要因になりました。米国で建設中のNAIRRインフラは、現在の人工知能技術の革新と開発が直面する新たな課題の解決に役立ち、我が国にとって一定の参考となる重要性を持っており、我が国は全体的な計画と調整を強化し、インフラの建設を加速すべきである。コンピューティングインフラストラクチャとデータ基本リソースを開発し、データ要素市場を開発し、データリソースの収集と流通を促進し、人工知能の基礎技術研究とアプリケーションイノベーションを促進します。 ######終わり###### 著者: 中国情報通信技術院データ研究センター Lu Yapeng Wang Weiguo

編集者/フォーマット: Gai Beibei

査読者:Shu Wenqiong プロデューサー: リウ・チーチェン

「いいね!」とビューはすべてここにあります

以上が米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込みの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:sohu.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート