ホームページ テクノロジー周辺機器 AI 米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

Jun 03, 2023 pm 05:36 PM
AI 工事 期待される。

人工知能は、技術革命と産業変革の新たなラウンドを導く戦略的テクノロジーです。複数の研究結果とデータは、米国が人工知能の基礎科学研究、技術革新、産業応用において世界をリードしていることを示しており、高度な人工知能論文、トップ学者の数、人工知能企業の数などの指標が示されています。 、投資規模はいずれも他国を上回っています。

米国政府は、人工知能技術の革新と開発を非常に重視しています。 2020 年の国家 AI イニシアチブ法によると、議会は全米科学財団 (NSF) とホワイトハウス科学技術政策局 (OSTP) に対し、2023 年 1 月に米国を研究し策定するための作業グループを結成することを要求しています。人工知能研究リソース (NAIRR) インフラストラクチャ構築ロードマップは、人工知能分野における米国の競争上の優位性を強化し、米国のすべての関係者が主要な人工知能と教育リソースを入手する機会を拡大し、米国の人工知能のイノベーションと教育をさらに推進します。経済的繁栄。

米国NAIRR建設の背景と意義

建設の背景

米国政府は、人工知能分野における自国の最先端が挑戦され、競争上の優位性が弱まる危険があると考えています。問題は主に 2 つあります。まず、人工知能の研究開発と教育リソースへの投資が不均等に配分されています。調査データによると、投資の観点から見ると、米国の民間部門からの人工知能への投資額は 2020 年から 2021 年にかけて 2 倍以上に増加しましたが、新しい人工知能企業の数は減少しており、人材の観点から見ると人口は減少しています。米国の人工知能博士課程卒業生の人種と人口の分布、性別分布、実際の人口比率は大きく異なり、それが人工知能の革新と開発を制限することになります。第二に、科学研究機関にはコンピューティングリソースとデータリソースが不足しています。コンピューティング能力の観点から見ると、最先端のコンピューティング パワー プラットフォームは業界をリードする民間機関が所有しており、科学研究機関には人工知能の研究開発をサポートするコンピューティング パワー プラットフォームが不足しています。データ リソースの観点から見ると、人工知能の主要なデータ リソースは人工知能モデルのトレーニングは民間機関と大規模なインターネットオールプラットフォームによって所有されており、米国政府はデータの公開を続けていますが、人工知能の研究にはまだ不十分です。

ワーキンググループは、十分な人工知能研究リソースの欠如が米国の人工知能イノベーションエコシステムを制限し、学術研究機関から優秀な人材が少数のリソース豊富な企業に集中することにつながると指摘しました。長期的に確立されれば、米国の競争力と競争力に影響を与えるでしょう。 18か月にわたる意見公募と議論を経て、2023年1月、作業部会は正式に建設計画を提案し、建設費と運営維持費として26億ドルを申請する予定であり、NAIRR建設工事は4期に分けて完了する予定である。 6 年以内に、次の 4 つの主要目標を達成することに重点を置きます。研究革新を促進するためのリソースを収集し、人材の多様性を強化し、基本的なリソースの能力を強化し、信頼できる人工知能の開発を促進します。

重要性

NAIRR は、人工知能の研究インフラとして、米国の研究学校、学生、非営利団体、その他の機関に公開されており、コンピューティング リソース、高品質のデータ、教育ツール、その他の基礎研究リソースを提供しています。国際競争上の優位性を強化するための重要な拠点として、米国の人工知能研究協力となることを目指しています。

生態学的構築の観点から、米国政府は NAIRR を利用して政府内の関連部門と科学研究機関を結集させ、人工知能分野での協力研究と資源構築を共同で実施し、広範な協力的な生態系を形成する予定です。 NAIRR のサービスと機能を図 1 に示します。

米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

データに関しては、NAIRR は連邦政府部門からのデータを集約し、業界のさまざまな機関とデータ サービス協力を実施します。 1 つ目は、大規模な人工知能データ リソースの集約、開発、利用を促進することであり、米国連邦機関、学術研究機関、テクノロジー大手によってオープンソース化されている大規模なデータ リソースを収集して接続し、米国最大の人工知能データ リソース サービス プラットフォーム。たとえば、米国国立衛生研究所は 36PB を超える遺伝子配列データを公開し、米国海洋大気庁は 10PB を超える気象および環境データを公開しています。 2 つ目は、人工知能のデータ管理とガバナンス能力の向上を促進することです。人工知能のデータ セットは高度に断片化されており、各データ セットは特殊なタスクと研究分野をサポートしていますが、データ アノテーションとデータ ガバナンスに関する統一基準が欠如しているため、データ管理が困難になっています。 NAIRRは、データ集約のための統一標準の確立を促進し、データ記述形式を標準化し、マルチパーティデータリソースの集約を促進します。 3つ目は、多者連携によるデータリソースの開発・活用の推進です。運営主体は人工知能データセットコミュニティを運営し、コミュニティがNAIRRが使用する貴重なデータリソースを積極的に開発、構築することを奨励します。運営主体はまた、連邦政府機関のオープンデータやサードパーティのサービスプロバイダーからのデータリソースのクエリを容易にするデータ検索サービスも提供します。

コンピューティング能力の面では、NAIRR は米国の大手人工知能コンピューティング クラウド プラットフォーム企業と提携してコンピューティング パワー プラットフォームを構築し、Google、Microsoft、Amazon などのテクノロジー巨人のクラウド プラットフォームと接続する予定です。米国自然科学財団、米国国立衛生研究所などの連邦機関向けクラウド プラットフォーム。このプラットフォームは、データ、コンピューティング能力、テストベッド、ソフトウェア ツールなどのさまざまなサービスとリソースを含む、さまざまなレベルのサービス モデルとコンテンツを大学、研究機関、学生、新興企業向けに提供します。完成後、NAIRR のコンピューティング リソースには、少なくとも 1 兆パラメータ規模の機械学習モデルのトレーニングをサポートするスーパーコンピューターに加え、クラウド コンピューティング リソース、CPU、GPU、高速ネットワークが含まれることになります。

NAIRR インフラストラクチャが確立され、安定的に運用された後は、一方では政府部門や民間機関との協力を拡大し、プラットフォーム サービスとユーザーの範囲を拡大し、成功体験を促進し続けます。このプラットフォームは、関連する標準と仕様の策定を促進し、国際交流と協力に参加し、米国とその同盟国およびパートナーのための基本プラットフォームとして機能し、共同研究とデータ共有を促進します。

アメリカNAIRR建設計画

米国は、体系的なアプローチを使用して連邦政府と民間機関を動員し、協力して学術研究のための人工知能研究リソースのインフラストラクチャを確立することを計画しています。

1 つ目は、複数の当事者が参加するプラットフォーム ガバナンス システムを計画および構築することです。 NAIRR が提案するガバナンス構造を図 2 に示します。この計画では、政府部門の多者参加によるガバナンスシステムの確立と、運営委員会、管理委員会、プロジェクト管理室、運営主体、協力を調整するための諮問委員会などの一連の責任組織の設立を推奨している。連邦政府のさまざまな省庁の代表者で構成される運営委員会を設立する。これは NAIRR の全体的な計画と戦略目標に関する国家レベルの最高意思決定機関である。この分野における国の資源投資を促進するためにさまざまな部門を代表する。人工知能の。プラットフォーム運営主体を指導・管理し、資金や関連リソースを提供するために管理委員会が設立されます。この計画では、NSF が管理委員会の責任を引き受けることが提案されています。運営委員会と連携して運営主体の日常管理・評価を行うプロジェクト管理室を設置する。米国議会は、関連するプロジェクト管理、ポータルの開発と展開、共同サポート、トレーニング、ユーザー サポートをサポートするプロジェクト管理局への資金提供を承認しました。政府部門から独立した運営組織を設立し、NAIRRの具体的な開発目標の策定、プラットフォーム構築と日常の運用管理の組織化、さまざまな人工知能研究機関のニーズを満たす透明かつ公正かつ合理的なリソース配分システムの策定を担当します。そしてユーザー。 NAIRR建設の意思決定を支援するために、多分野の専門家から構成される科学委員会、技術委員会、倫理委員会、利用者委員会が設置されています。

米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込み

2 つ目は、NAIRR のインフラ運営と建設に専用の資金を提供することです。建設計画では、6年間で26億米ドルの資金を申請することが提案されており、そのうち22億5,000万米ドルは、サービスプロバイダーからプラットフォームのコンピューティング能力、ソフトウェアツール、データリソースを購入するために使用され、運営組織の1日の経費は370米ドルとなる予定です。 100万米ドルが使われ、さらに3,000万米ドルがインフラ運用に使用される予定です。人工知能の研究開発に関与するすべての連邦機関は、NAIRR のプロジェクト管理に参加する必要があります。人工知能分野における連邦省庁による研究開発投資は、引き続き各省庁が単独または共同で購入および開発することができますが、NAIRR インフラストラクチャを通じて管理および提供される必要があります。

3つ目は、NAIRRインフラを段階的に構築し、必要に応じてコンピューティングリソースを拡張し、データリソースの集約を推進することです。プラットフォームの構築は、プロジェクトの開始、構築、試行運用、継続運用の4つの段階に分かれています。試験運用段階では5万人のユーザーをサポートでき、既存の連邦機関のデータと民間機関のデータを集約して利用できる。安定運用後は15万人のユーザーをサポートし、より広範なデータリソース協力コミュニティを確立する予定だ。 NAIRRは、データアグリゲーション標準の策定、データ連携開発、データ検索サービスの提供など、データ活用を促進するためのデータリソースの開発を行っていきます。

新たな状況のもとで、人工知能の基礎研究リソースを構築する重要性がますます顕著になっています。 現在、人工知能の新しいテクノロジーと新しいアプリケーションが絶えず出現しており、大規模言語モデル ChatGPT に代表される新世代の大規模人工知能モデルの研究とトレーニングには、より大規模なコンピューティング リソースとデータ リソースのサポートが必要です。そして、単一の研究開発投資は大幅に増加しました。大規模な人工知能モデルのトレーニングのためのコンピューティング パワー プラットフォームのしきい値は非常に高く、通常の機関には巨額の研究開発費や運営費を支払う余裕はありません。 OpenAI の調査によると、人工知能モデルのトレーニングに必要なコンピューティング パワーは指数関数的に増加しており、2012 年から 2018 年にかけて、AI モデルのトレーニングに消費されるコンピューティング パワーは 30 万倍に増加しました。 GPT3 のトレーニングに必要な計算能力は 3640pfsday (つまり、1PetaFLOP/s の効率が 3640 日間実行される) に達し、トレーニング費用は 1 回あたり 140 万米ドルに達すると予想されており、ChatGPT の初期投資コストは約米ドルであると見積もっている組織もあります。 8億ドル。

人工知能のデータセットに関しては、大規模な事前トレーニング済みモデルの研究開発により、トレーニングに必要なデータセットのサイズがさらに大幅に増加しており、データサイズは、昔の数百万から数千万から増加しています。過去から数億まで。大規模モデルのトレーニングで使用される現在のデータ セットは、主にインターネットから取得されており、ウィキペディア、ソーシャル ネットワーキング サイト、公的ジャーナル、書籍、論文、コードなどのデータベースが含まれます。いくつかの研究では、「トレーニング データが大規模モデルの産業化に対する最大の制約の 1 つになるだろう。より深い観点から見ると、大規模モデルには、データの収集や時間のかかるラベル付けなど、トレーニング データの観点から依然としてさまざまなガバナンスの問題が存在する」と指摘されています。・消費、労力、コストがかかり、データ品質が難しい 「ロングテール」やエッジケースをカバーするための保証やデータの多様化が不十分であり、特定のデータの取得、使用、共有におけるプライバシー保護やデータの偏りなどの問題がある外国の学者による研究では、言語データの全体的な規模は 7% の割合で増加していると考えられています。高品質の言語データの増加は、人口規模や経済発展などの要因に左右され、4 % の割合で増加しています。 %から5%。大規模な言語モデルをトレーニングするための高品質のデータは、2027 年までに「枯渇」すると予想されます。

######まとめ######

コンピューティング能力とデータ リソースは、人工知能技術研究の基本的なサポート要素です。人工知能が「ビッグ モデル」時代に突入するにつれ、コンピューティング能力とデータ能力がアルゴリズム モデルの研究とトレーニングの制限要因になりました。米国で建設中のNAIRRインフラは、現在の人工知能技術の革新と開発が直面する新たな課題の解決に役立ち、我が国にとって一定の参考となる重要性を持っており、我が国は全体的な計画と調整を強化し、インフラの建設を加速すべきである。コンピューティングインフラストラクチャとデータ基本リソースを開発し、データ要素市場を開発し、データリソースの収集と流通を促進し、人工知能の基礎技術研究とアプリケーションイノベーションを促進します。 ######終わり###### 著者: 中国情報通信技術院データ研究センター Lu Yapeng Wang Weiguo

編集者/フォーマット: Gai Beibei

査読者:Shu Wenqiong プロデューサー: リウ・チーチェン

「いいね!」とビューはすべてここにあります

以上が米国は人工知能に26億ドルを費やし…NAIRRの建設は6年以内に完了する見込みの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Jun 28, 2024 am 03:51 AM

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Jun 10, 2024 am 11:08 AM

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

GenAI および LLM の技術面接に関する 7 つのクールな質問 GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります 微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります Jun 11, 2024 pm 03:57 PM

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

あなたが知らない機械学習の 5 つの流派 あなたが知らない機械学習の 5 つの流派 Jun 05, 2024 pm 08:51 PM

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 Jul 17, 2024 pm 06:37 PM

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性​​を実証しています。 「S」で始まる関連研究

SKハイニックスは8月6日に12層HBM3E、321層NANDなどのAI関連新製品を展示する。 SKハイニックスは8月6日に12層HBM3E、321層NANDなどのAI関連新製品を展示する。 Aug 01, 2024 pm 09:40 PM

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス

See all articles