本日、スタンフォード大学は 2023 年の AI インデックス レポートを発表しました。
スタンフォード AI インデックス レポートでは、「AI 論文出版量」の観点から世界のトップ 10 機関がリストされている点は注目に値します。そのうち9人は全員中国出身で、MITに追いついた。
それらは、中国科学院、清華大学、中国科学院大学、上海交通大学、浙江大学、ハルビン工業大学、北杭大学、電子科学大学です。中国の技術、北京大学、MIT。
今年のレポートは主に、研究開発、技術パフォーマンス、人工知能技術倫理、経済、教育、政策、およびガバナンス、多様性、世論。
次の内容は、レポートのいくつかの重要なポイントを抜粋したものです。
2010 年から 2021 年にかけて、AI 論文における国境を越えた協力のペースは鈍化しましたが、 2010年、米国と中国との人工知能研究協力件数は約4倍に増加し、これは中国と英国の協力総額の2.5倍に相当する。
しかし、2020年から2021年にかけて、両国間の協力総額は2.1%増加にとどまり、2010年以来最も小さな前年比増加率となった。
さらに、AI 論文の総数は 2010 年以来 2 倍以上に増加しています。 2010 年の 20 万記事から、2021 年には 50 万近くの記事 (49,601) に増加しました。
#出版された AI 論文の種類に関しては、2021 年に出版されたすべての AI 論文の 60% がジャーナル論文、17% がカンファレンス論文です。論文、13% はリポジトリからのものです。
過去 12 年間でジャーナル論文とリポジトリ論文はそれぞれ 3 倍と 26.6 倍に増加しましたが、会議論文の数は 2019 年以降減少しています。
パターン認識、機械学習、コンピューター ビジョンは、依然として人工知能の分野でホットなトピックです。
中国は、ジャーナル、学会、リポジトリの論文総数において依然としてトップを走っています。
米国は依然として AI カンファレンスとリポジトリの引用数でリードしていますが、そのリードは徐々に失われつつあります。それにもかかわらず、世界の大規模言語モデルとマルチモーダル モデルの大部分 (2022 年には 54%) は米国の機関によって作成されています。
中国は AI ランキングのトップを独占しているが、引用数は米国よりも少ない中国は常にAI ジャーナル論文の出版状況では、2021 年に 39.8% で首位を維持し、欧州連合と英国 (15.1%)、米国 (10.0%) が続きます。
2010 年以降、中国の人工知能に関するジャーナル論文の引用割合が徐々に増加している一方、EU、英国、米国はいずれも減少しています。 。中国、欧州連合、英国、米国が世界全体の引用数の 65.7% を占めています。
それでは、世界のトップカンファレンスで発表される論文の状況はどうなっているのでしょうか?
2021 年、主要な世界的 AI カンファレンスで発表された論文のシェアは中国が 26.15% で最も多く、次いで欧州連合と英国が 20.29%、米国が続きます。 17.23%で3位にランクされました。
トップ会議論文の引用数から判断すると、中国は生産性が高いにもかかわらず、米国に比べて引用数が少ないことがわかります。米国の主要会議論文の引用数は 23.9%、中国では 22.02% でした。
中国は論文数が最も多いのは傍から見てもわかりますが、質は米国ほどではありません。
AI 論文リポジトリへの投稿では、米国が 23.48% で世界をリードしています。最も低いのは中国の11.87%。
2021 年、出版論文総数は世界の 1 位に各機関の論文数の合計は以下の通りで、MITは10位で1745本の論文を発表している。
コンピュータ ビジョン (CV) の分野では、中国の 10 の教育機関が世界のトップ 10 にランクされています。科学院、上海交通大学、中国科学院大学、清華大学、浙江大学、北杭大学、武漢大学、北京工業大学、ハルビン工業大学、天津大学。
自然言語処理 (NLP) の分野では、状況は異なります。
世界のトップ10の機関/企業は次のとおりです: 中国科学院、カーネギーメロン大学、マイクロソフト、清華大学、オーストラリア・カーネギーメロン大学、グーグル、北京大学、北京大学中国科学院、アリババ、アマゾン。
#音声認識分野のランキングは次のとおりです。
業界が学術界をリード2022 年にリリースされた重要な人工知能機械学習システムの中で、言語システムが最も多くを占め、マルチモーダル システムの数の 6 倍である 23 を占めています。
論文の生産量に関しては、産業界が学術界を上回っています。
2014 年まで、ほとんどの重要なモデルは学術界によって発表されていました。それ以来、業界は好転しました。 2022 年までに、産業界では 32 の重要な機械学習モデルが誕生しますが、学術界では 3 モデルのみになります。
非営利団体や学術界と比較して、最先端の人工知能システムの構築にはますます多額の費用が必要になることがわかります。データ、コンピュータの能力、資金力が向上しており、業界参加者はこれを行うためのより多くの資金力を確実に持っています。
2022 年に米国が 16 で最も多くの重要な機械学習システムを開発し、次いで英国 (8)、中国 (3) でした。
# さらに、2002 年以降、作成された重要な機械学習システムの総数において、米国は英国、欧州連合、中国を上回りました
これらの重要な AI システムを支えている研究者の分布を国別に見ると、米国の研究者数が 285 人と最も多く、英国の 2 倍以上です。中国の約6倍だ。
LLM はますます大きくなり、コンピューティング能力はより高価になります大規模な言語モデルとマルチモーダル モデルが必要になる場合があります。ベース モデル と呼ばれるこれは、大量のデータでトレーニングされ、さまざまなダウンストリーム アプリケーションに適した、現在新興の人気が高まっているタイプの AI モデルです。
ChatGPT、DALL-E 2、MakeA-Video などの大規模言語とマルチモーダル モデルは、優れた機能を実証しており、実際の現場で広く導入され始めています。世界。
これらのモデルの著者の所属国が分析されたところ、これらの研究者の大部分は米国の機関の出身でした (54.2%)。
Stanford AI Index レポートには、大規模な言語モデルとマルチモーダル モデルのリリースのタイムラインも示されています。
#大規模な言語モデルは、ますます大きくなり、より高価になります。
最初の大規模言語モデル GPT-2 は 2019 年にリリースされ、パラメーター数は 15 億、トレーニング費用は約 50,000 ドルでした。 Google PaLM は 2022 年に発表された大規模な言語モデルの 1 つで、パラメータ数は 5,400 億、コストは最大 800 万ドルです。
パラメータとトレーニング コストの点で、Palm は GPT-2 よりも 360 倍大きく、160 倍高価です。
Palm に限ったことではありませんが、大規模な言語モデルとマルチモーダル モデル全体が大規模になり、より高価になっています。
たとえば、DeepMind が 2022 年 5 月に発表した大規模言語モデルである Chinchilla の費用は 210 万米ドルと推定されていますが、BLOOM のトレーニングには約 230 万米ドルかかります。
時間の経過とともに、顔生成における GAN の進歩により、最後の画像は Diffusion-GAN によって生成され、このモデルは STL で作成されました。最新の SOTA は次のとおりです。 -10に取得。
昨年、OpenAI の DALL-E 2、Stability AI の Stable Diffusion、Midjourney、Meta の Make-AScene、Google の Imagen がリリースされました。このモデル、テキストから画像への生成モデルは徐々に世間の注目を集めるようになりました。
次のように、公的にアクセス可能な 3 つのプログラム、DALL-E 2、Stable Diffusion、Midjourney からそれぞれ、同じプロンプト「暖かいパリの夜にパンダがピアノを演奏します」を入力します。 . AI text-to-image システムによって生成された画像。
最近リリースされたテキストから画像への生成モデルの中で、Google の Imagen は COCO ベンチマークで最高のパフォーマンスを発揮します。
今年、Imagen を作成した Google 研究者は、ますます強力になるテキストから画像へのモデルに挑戦するために設計された、より困難なテキストから画像へのベンチマークである DrawBench もリリースしました。
さらに、レポートでは、現在の生成 AI モデルにはいくつかのバイアスがあることも紹介しました。 2、みんな腕を組んで自信満々のポーズをとっているように見えました。
Midjourney では、「インフルエンサー」を生成するように求められると、年上に見える白人男性の 4 つの画像が生成されます。
#レポートの完全な内容については、次を参照してください。
# # https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf
以上がスタンフォード 2023 AI インデックス レポートが発表されました。中国は主要な AI カンファレンスを独占しており、中国科学院は論文数で世界第 1 位にランクされていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。