ChatGPT の背後にある研究力の解釈: 90 年代以降の世代が主力となり、トップ AI 人材にとって大手メーカーはもはや第一の選択肢ではない
ChatGPT の人気は、OpenAI に大きな注目とユーザーの好意をもたらしただけでなく、「なぜ OpenAI が ChatGPT を作れるのか」に関する議論において、その人的優位性も外部からの注目の的となっています。
最近、Wisdom Research と AMiner は、OpenAI の背後にある研究チームからの統計レポートを発表しました。報告書によると、今回ChatGPTプロジェクトに貢献した人は87名で、その中には「非常に若い」「豪華な経歴を持つ」「テクノロジーに注力している」「深い蓄積がある」「起業家精神を提唱している」といった人が含まれているとのこと。 「中華“アイキャッチ”」などの特徴をご紹介します。
レポートリンク: https://mp.weixin.qq.com/s/Y_LjjsuoEEmhIg5WO_iQhA
このような 100 人未満のチームから、驚異的な大規模言語モデル ChatGPT が誕生しました。これは、Google、Microsoft、Baidu、 ChatGPT のような製品のリリースまたはプレリリースに対する圧力が緊密に続いています。
非営利の人工知能研究機関として、OpenAI は常に、AI のキャリア開発に興味を持つ多くの若い才能にとって技術の楽園とみなされてきました。ここでは、最先端かつ創造的な AI プロジェクトに直接参加し、中核となる科学研究リソースを動員し、気を散らすことなく技術革新に専念することができます。
近年、疎外と優柔不断により、国内大手メーカーの AI 研究機関や科学研究人材は存続困難に直面していますが、ChatGPT の影響で、AI 人材はさらに危機に瀕していると私は考えています。再び世間の注目を浴びることで、新たな競争と人事異動が始まることになる。
1
技術系人材が9割近くを占める90年代以降の世代が主力from ChatGPT チームの職種 (図 1) から判断すると、このプロジェクトに参加している 87 名のうち、研究開発要員の数は 77 名に達し、88% を占めています。その中には、同社の共同創設者である Wojciech Zaremba 氏も含まれます。博士は以前、2023 AI 2000 ロボット工学分野で最も影響力のある学者に選ばれました。
製品担当者は5%の4名で、さらに6名の参加者の位置情報は取得できません。
図 1: ChatGPT チームのポジション分けメンバーの年齢構成(図2)を見ると、90年代以降の世代がチームの主力となっており、うち20~29歳のメンバーが28名で34%を占め、90年代以降の世代がチームの主力となっている。会員数は30~39歳が最多の28名、50名で61%を占め、他に40~49歳が3名、そして60歳以上の人は1人だけです。
統計によると、この研究チームの平均年齢は 32 歳です。
# # 「年齢が高い」と「テクノロジーに注力している」という 2 つの大きな特徴は、ChatGPT チームのメンバーの 2 つの大きな特徴です。
平均年齢はわずか 32 歳ですが、チーム メンバーはテクノロジーの研究開発に非常に注力しており、AI のイノベーションと研究開発に対する多大な関心と全力の取り組みに基づいて、彼らは、世界を爆発させたこの新しいテクノロジーを生み出しました。ラウンドテクノロジーの驚異的なモデルです。研究開発の経験が乏しいと思われる若手が最先端の科学技術分野で飛躍する可能性は十分にあることがわかります。現在、中国では OpenAI のような若い才能が不足していません。
ChatGPT の出現後、IDEA Research Institute の主席科学者 Zhang Jiaxing は、昨年末にチームの大規模モデル開発を ChatGPT の会話型タスク ラインにすぐに移行しました。
彼の開示によれば、彼のチームの主な研究部隊も1990年代生まれの傑出した若い才能である。現在、彼らが開発したChatGPT類似モデルはChatGPTと同等の効率性を持ち、パラメータ数はわずか50億個で、テキスト生成速度も非常に高速であり、現在内部テスト中であり、近い将来公開テストされる予定である。 ChatGPT チームメンバーの学士、修士、博士の学位取得者数は比較的バランスが取れており、そのうち学士27名、修士25名、博士28名と33%、30名が学士号を取得しています。それぞれ %、37%。 その中で、卒業生の数が最も多いのはスタンフォード大学で合計 14 名、次いで UC バークレーが 10 名、MIT が 7 名で 3 位となっています。 2
9 人は名門学校で教育を受けており、中国人です
大工場はもはや優秀な人材にとっての第一の選択肢ではありません
図 3: 大学を卒業した ChatGPT チーム メンバーの数トップ 10
##チーム内では中国人学者が科学技術イノベーションの重要な戦力となっており、合計9名で10%近くを占めている。このうち、5名は中国の大学を卒業し、3名は清華大学で学士号を取得しており、Weng Jiayi、Zhao Shengjia、Yuan Qimingが現在研究開発エンジニアとして働いています。チームのポジションには、華中科学技術大学と北京大学/香港大学で学士号を取得した 1 人、つまり Jiang Xu と Weng Lilian がいます。
彼らは全員、国内トップクラスの大学を卒業し、修士号または博士号を取得した後、さらなる研究のために米国に留学しました。
チームメンバーのうち、合計 5 名が 2023 AI 2000 グローバル人工知能奨学生に指名されました。
1. OpenAI 共同創設者 Wojciech Zaremba (選択された分野とランキング: ロボット工学、10 位)
2. ChatGPT 研究者Lukasz Kaiser (選択した分野とランキング: 機械学習、10 位)
3. OpenAI 共同創設者および ChatGPT 研究科学者 John Schulman (選択した分野とランキング: 機械学習、41 位)
4.ChatGPT 研究開発エンジニア Tomer Kaftan (選択された分野とランキング: データベース、No. 52)
5.ChatGPT 研究科学者 Barret Zoph (選択した分野とランキング: 機械学習、95 位)
外部企業出身者、新卒者、科学研究機関、大学教員の割合はそれぞれ 81%、13% 、4%と3%で、そのほとんどはGoogle、Microsoft、Meta、Intel、NVIDIA、Appleなどのトップまたは有名なテクノロジー企業の出身です。合計10人がGoogleから参加し、1人がBaiduで働いていました提供されました。
図 5: ChatGPT チーム メンバーのフロー
# # 統計では、ChatGPT に関連する最初の 7 つの技術プロジェクトの研究開発において、ChatGPT チームのより多くの人が研究開発に参加していることも判明しました。
CodeX プロジェクトの参加者数が最も多く、合計 22 名が参加し、チームの 25% を占めます。次に、webGPT と instructGPT が合計 9 名が参加し、GPT3 は合計 9 名が参加しています。 6人参加で3位、4位はRLHFで3人参加。
図 6: ChatGPT チームのこれまでの 7 つの主要なテクノロジーの研究開発に携わった人の数
# ChatGPT は、OpenAI が長年にわたり大規模言語モデルの分野で技術を蓄積し、優秀な人材リーダーと優秀な AI 技術人材が集まり、これは、ChatGPT の開発を成功させるための強固な基盤を築きました。3
AI の人材が戦いの先駆けとなりました
実際、過去数年間で、AI 研究機関とAI の人材は長い間、大企業内での疎外と戦略の揺れというジレンマに直面しており、前述の Google と同様に、多くの人材が OpenAI のような純粋な科学研究の聖地に流れてきました。大規模工場内の AI 担当者は、企業の組織構造モデル内で能力や成果を伸ばすことが難しいと感じることがよくあります。
しかし、従来のテクノロジー大手とは異なり、OpenAI のような企業が「人工知能の開発」を自らの使命とする場合、AI の研究開発とイノベーションは彼らの使命、つまり最も最先端の技術に参加することになります。 -edge AI プロジェクトは緊密に行われ、最もコアなリソースを研究開発に使用しますが、舞台裏では長期間成果が出ない責任に耐えることが必要です。中でも GPT モデルは、最初の立ち上げからトレーニング完了までに最大 3 年かかり、チームからの資金、技術、人材の体系的な保証が必要でした。
ChatGPT の出現により、AI 人材が再び世間の注目を集めるようになり、純粋な科学研究の重要性が改めて強調され、人材競争の新たなラウンドが始まることは間違いありません。同時に、大手製造業者は大型モデルやコンピューティングリソースなどのインフラストラクチャに重点を置き、基礎的な技術能力のキャッチアップと補完を加速することになる。
Sogou の元 CEO、Wang Xiaochuan 氏が Weibo で述べたように、「OpenAI の成功は、まず第一に技術的理想主義の勝利です。」ChatGPT の成功は必然的に産業界、学術界、 、研究協力、その背後にはチームメンバーの人工知能技術に対する関心とそれに対する信念があります。中国には科学研究のトップ人材が不足しておらず、最先端の技術革新に注力し、着実に進めることは、中国におけるAIイノベーションの発展を促進する上で大きな意義がある。
以上がChatGPT の背後にある研究力の解釈: 90 年代以降の世代が主力となり、トップ AI 人材にとって大手メーカーはもはや第一の選択肢ではないの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









大規模言語モデル (LLM) は、自然言語理解、言語生成、複雑な推論などの多くの重要なタスクにおいて説得力のある能力を実証し、社会に大きな影響を与えてきました。ただし、これらの優れた機能には、大量のトレーニング リソース (左の図に示す) と長い推論時間 (右の図に示す) が必要です。したがって、研究者は効率の問題を解決するための効果的な技術的手段を開発する必要があります。さらに、図の右側からわかるように、Mistral-7B などのいくつかの効率的な LLM (LanguageModel) が、LLM の設計と展開にうまく使用されています。これらの効率的な LLM は、LLaMA1-33B と同様の精度を維持しながら、推論メモリを大幅に削減できます。

StableDiffusion3 の論文がついに登場しました!このモデルは2週間前にリリースされ、Soraと同じDiT(DiffusionTransformer)アーキテクチャを採用しており、リリースされると大きな話題を呼びました。前バージョンと比較して、StableDiffusion3で生成される画像の品質が大幅に向上し、マルチテーマプロンプトに対応したほか、テキスト書き込み効果も向上し、文字化けが発生しなくなりました。 StabilityAI は、StableDiffusion3 はパラメータ サイズが 800M から 8B までの一連のモデルであると指摘しました。このパラメーター範囲は、モデルを多くのポータブル デバイス上で直接実行できることを意味し、AI の使用を大幅に削減します。

自動運転では軌道予測が重要な役割を果たしており、自動運転軌道予測とは、車両の走行過程におけるさまざまなデータを分析し、将来の車両の走行軌跡を予測することを指します。自動運転のコアモジュールとして、軌道予測の品質は下流の計画制御にとって非常に重要です。軌道予測タスクには豊富な技術スタックがあり、自動運転の動的/静的知覚、高精度地図、車線境界線、ニューラル ネットワーク アーキテクチャ (CNN&GNN&Transformer) スキルなどに精通している必要があります。始めるのは非常に困難です。多くのファンは、できるだけ早く軌道予測を始めて、落とし穴を避けたいと考えています。今日は、軌道予測に関するよくある問題と入門的な学習方法を取り上げます。関連知識の紹介 1. プレビュー用紙は整っていますか? A: まずアンケートを見てください。

この論文では、自動運転においてさまざまな視野角 (遠近法や鳥瞰図など) から物体を正確に検出するという問題、特に、特徴を遠近法 (PV) 空間から鳥瞰図 (BEV) 空間に効果的に変換する方法について検討します。 Visual Transformation (VT) モジュールを介して実装されます。既存の手法は、2D から 3D への変換と 3D から 2D への変換という 2 つの戦略に大別されます。 2D から 3D への手法は、深さの確率を予測することで高密度の 2D フィーチャを改善しますが、特に遠方の領域では、深さ予測に固有の不確実性により不正確さが生じる可能性があります。 3D から 2D への方法では通常、3D クエリを使用して 2D フィーチャをサンプリングし、Transformer を通じて 3D と 2D フィーチャ間の対応のアテンション ウェイトを学習します。これにより、計算時間と展開時間が増加します。

著者の個人的な考えの一部 自動運転の分野では、BEV ベースのサブタスク/エンドツーエンド ソリューションの開発に伴い、高品質のマルチビュー トレーニング データとそれに対応するシミュレーション シーンの構築がますます重要になってきています。現在のタスクの問題点に対応して、「高品質」は 3 つの側面に分離できます。 さまざまな次元のロングテール シナリオ: 障害物データ内の近距離車両、車両切断中の正確な進行角、車線などラインデータ 曲率の異なるカーブやランプ・合流・合流などの撮影が難しいシーン。これらは多くの場合、大量のデータ収集と複雑なデータ マイニング戦略に依存しており、コストがかかります。 3D 真の値 - 一貫性の高い画像: 現在の BEV データ取得は、センサーの設置/校正、高精度マップ、再構成アルゴリズム自体のエラーの影響を受けることがよくあります。これが私を導いた

この四角い男性は、目の前にいる「招かれざる客」の正体について考えながら眉をひそめていることに注意してください。彼女が危険な状況にあることが判明し、これに気づくと、彼女は問題を解決するための戦略を見つけるためにすぐに頭の中で探索を始めました。最終的に、彼女は現場から逃走し、できるだけ早く助けを求め、直ちに行動を起こすことにしました。同時に、反対側の人も彼女と同じことを考えていた……『マインクラフト』では、登場人物全員が人工知能によって制御されている、そんなシーンがありました。それぞれに個性的な設定があり、例えば先ほどの女の子は17歳ながら賢くて勇敢な配達員です。彼らは記憶力と思考力を持ち、Minecraft の舞台となるこの小さな町で人間と同じように暮らしています。彼らを動かすのはまったく新しいものであり、

画像からビデオへの生成 (I2V) タスクは、静止画像を動的なビデオに変換することを目的としたコンピューター ビジョンの分野における課題です。このタスクの難しさは、画像コンテンツの信頼性と視覚的な一貫性を維持しながら、単一の画像から時間次元で動的な情報を抽出して生成することです。既存の I2V 手法では、多くの場合、この目標を達成するために複雑なモデル アーキテクチャと大量のトレーニング データが必要になります。最近、Kuaishou が主導した新しい研究成果「I2V-Adapter: AGeneralImage-to-VideoAdapter for VideoDiffusionModels」が発表されました。この研究では、革新的な画像からビデオへの変換方法を導入し、軽量のアダプター モジュールを提案します。

9 月 23 日、論文「DeepModelFusion:ASurvey」が国立国防技術大学、JD.com、北京理工大学によって発表されました。ディープ モデルの融合/マージは、複数のディープ ラーニング モデルのパラメーターまたは予測を 1 つのモデルに結合する新しいテクノロジーです。さまざまなモデルの機能を組み合わせて、個々のモデルのバイアスとエラーを補償し、パフォーマンスを向上させます。大規模な深層学習モデル (LLM や基本モデルなど) での深層モデルの融合は、高い計算コスト、高次元のパラメーター空間、異なる異種モデル間の干渉など、いくつかの課題に直面しています。この記事では、既存のディープ モデル フュージョン手法を 4 つのカテゴリに分類します。 (1) 「パターン接続」。損失低減パスを介して重み空間内の解を接続し、より適切な初期モデル フュージョンを取得します。
