GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決-AI-php.cn

Yann LeCun の中心的な視点

もちろん、ルカン氏のアイデアはすべての人の支持を得られるわけではありません。少なくとも、ノイズは聞こえてきました。

ホームページ

テクノロジー周辺機器

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

王林

Apr 04, 2023 am 11:55 AM

ai 研究

ヤン・ルカンこの視点は確かに少し大胆です。

「正気の人間であれば、5 年後には自己回帰モデルを使用する人はいないでしょう。」最近、チューリング賞受賞者のヤン・ルカン氏が、討論会に特別な口火を切った。彼が語る自己回帰は、まさに現在人気のある GPT ファミリーモデルが依存している学習パラダイムです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

もちろん、Yann LeCun が指摘したのは自己回帰モデルだけではありません。同氏の見解では、機械学習の分野全体が現在、大きな課題に直面しているという。

この議論のテーマは「大規模言語モデルには意味と理解のための感覚的根拠が必要か?」であり、最近開催された「深層学習の哲学」カンファレンスの一部です。この会議では、人工知能研究における現在の問題、特に深層人工ニューラルネットワークの分野における最近の研究を哲学的な観点から検討しました。その目的は、これらのシステムについて考えている哲学者や科学者を集めて、これらのモデルの機能、限界、人間の認知との関係をより深く理解することです。

討論 PPT によると、Yann LeCun はいつもの鋭いスタイルを続け、「機械学習は最低だ!」「自己回帰生成モデルは最低だ!」と率直に指摘し、最後の話題は自然に「世界モデル」に戻った。。この記事では、ヤン・ルカン氏の核となるアイデアをPPTに基づいて整理します。

#フォローアップビデオ情報については、カンファレンスの公式 Web サイトに注目してください: https://phildeeplearning.github.io/

Yann LeCun の中心的な視点

機械学習は最悪です!

「機械学習は最悪です! (機械学習は最悪です)」 Yann LeCun はこのサブタイトルを PPT の冒頭に付けました。ただし、人間や動物と比較すると、と彼は付け加えた。

機械学習の何が問題なのでしょうか? LeCun は、状況に応じていくつかの項目を列挙しました:

教師あり学習 (SL) には多数のラベル付きサンプルが必要です;
強化学習 (RL) には多数の実験が必要です。

さらに、機械学習に基づく現在の AI システムのほとんどは、非常に愚かな間違いを犯し、推論したり計画したりすることができません。

それに比べて、人間と動物は、次のような多くのことができます。

自分自身の行動の結果を予測できるようになる。
は無限の複数ステップの推論チェーンを実行できます;
は計画のために複雑なタスクを一連のサブタスクに分解できます;

の方が重要です人間や動物には常識があるのに対し、現在の機械が持つ常識は比較的表面的なものであるということです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

自己回帰大規模言語モデルに未来はない

上記の 3 つの学習パラダイムの中で、Yann LeCun は自己監視学習に焦点を当てています。それを拾う。

最初にわかるのは、自己教師あり学習が現在の主流の学習パラダイムになっているということです。ルカン氏の言葉を借りると、「自己教師あり学習が世界を席巻した」ということです。近年、テキストと画像の理解と生成のための大規模モデルのほとんどがこの学習パラダイムを採用しています。

自己教師あり学習では、GPT ファミリに代表される自己回帰大規模言語モデル (AR-LLM) の人気が高まっています。これらのモデルの原理は、上記または以下に基づいて次のトークンを予測することです (ここでのトークンは単語、画像ブロック、または音声クリップにすることができます)。私たちがよく知っている LLaMA (FAIR) や ChatGPT (OpenAI) などのモデルはすべて自己回帰モデルです。

しかし、LeCun 氏の見解では、このタイプのモデルには未来はありません (自己回帰 LLM は運命づけられています)。なぜなら、そのパフォーマンスは驚くべきものですが、事実の誤り、論理的な誤り、矛盾、限られた推論、有害なコンテンツの容易な生成など、多くの問題を解決するのが難しいからです。重要なのは、そのようなモデルは世界の根底にある現実を理解していないということです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

技術的な観点から、任意に生成されたトークンによって正解セットから遠ざかる確率を e とすると、長さ n の答えが得られる確率は次のようになります。最終的には正解になります。つまり、P (正解) = (1-e)^n です。このアルゴリズムによれば、エラーが蓄積され、精度が指数関数的に低下します。もちろん、e を小さくすることでこの問題を (トレーニングを通じて) 軽減できますが、完全に排除することはできません、と Yann LeCun 氏は説明します。彼は、この問題を解決するには、モデルの滑らかさを維持しながら、LLM を自己回帰しないようにする必要があると考えています。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

LeCun は、有望な方向性があると信じています: 世界モデル

GPT クラスモデル現在脚光を浴びている未来がないとしたら、何が未来があるのでしょうか？ LeCun 氏によると、答えは「世界モデル」です。

LeCun 氏は長年にわたり、現在の大規模言語モデルは人間や動物に比べて学習効率が非常に悪いと強調してきました。車を運転したことがない 10 代の若者は 20 時間で学習できますが、運転を学ぶことはできます。最高の自動運転システムには、数百万または数十億のラベル付きデータ、または仮想環境での数百万回の強化学習トライアルが必要です。これだけの努力をしても、人間と同じような確実な運転能力を達成することはできません。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

したがって、現在の機械学習研究者が直面している 3 つの主要な課題があります: 1 つは世界の表現と予測モデルを学習すること、もう 1 つは推論を学習することです (システムは前述) by LeCun 2 関連する議論については、UCL の Wang Jun 教授のレポートを参照してください); 3 番目は、複雑なアクションシーケンスを計画する方法を学ぶことです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

これらの問題に基づいて、LeCun は「世界」モデルを構築するというアイデアを提案し、「自律型マシンインテリジェンスへの道」というタイトルの論文で発表しました。について詳しく説明されています。

具体的には、推論と計画が可能な認知アーキテクチャを構築したいと考えていました。このアーキテクチャは、6 つの独立したモジュールで構成されています:

Perception モジュール;
World model );
Cost モジュール;
アクターモジュール;
短期記憶モジュール。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

これらのモジュールの詳細については、Heart of the Machine の以前の記事「チューリング賞受賞者のヤン・ルカン氏: AI 研究における最大の課題」を参照してください。次の数十年は「予測世界モデル」です。

Yann LeCun は、PPT の以前の論文で述べたいくつかの詳細についても詳しく説明しました。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

#世界モデルを構築してトレーニングするにはどうすればよいですか?

LeCun 氏の見解では、今後数十年間の人工知能の開発に対する本当の障害は、世界モデルのアーキテクチャとトレーニングパラダイムの設計です。

ワールドモデルのトレーニングは自己教師あり学習 (SSL) の典型的な例であり、その基本的な考え方はパターン補完です。将来の入力 (または一時的に観測されなかった入力) の予測は、パターン補完の特殊なケースです。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決世界モデルを構築してトレーニングするにはどうすればよいですか?注意しなければならないのは、世界は部分的にしか予測できないということです。まず問題は、予測の不確実性をどのように特徴づけるかです。

それでは、予測モデルはどのようにして複数の予測を表現できるのでしょうか?

確率モデルは連続領域で実装するのが困難ですが、生成モデルは世界のあらゆる詳細を予測する必要があります。

これに基づいて、LeCun は、Joint-Embedding Predictive Architecture (JEPA) というソリューションを提案しました。

JEPA は、x から y を予測するために簡単に使用できないため、生成的ではありません。 y の予測を明示的に生成することなく、x と y の間の依存関係のみをキャプチャします。

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

JEPA 全般。

上の図に示すように、このアーキテクチャでは、x は過去と現在の観測、y は未来、a はアクション、z は未知の潜在変数、D() は予測コスト、C() は代替コストを表します。 JEPA は、過去と現在の S_x の表現から将来の S_y の表現を予測します。

生成アーキテクチャは、無関係なものも含めて y の詳細をすべて予測しますが、JEPA は y の抽象表現を予測します。

この場合、LeCun 氏は、「完全に実現する必要がある」アイデアが 5 つあると考えています。放棄》:

生成モデルを放棄し、結合埋め込みアーキテクチャをサポートします;

自己回帰生成を放棄します;

確率モデルを放棄し、エネルギーモデルをサポートします。

対比法を放棄し、正則化法をサポートします。

強化学習を放棄し、モデルの予測制御をサポートします。

彼の提案は、計画が予測された結果をもたらさない場合にのみ RL を使用して、世界モデルまたは批評家を調整することです。

エネルギーモデルと同様に、JEPA は対照的な方法を使用してトレーニングできます。ただし、対照的な方法は高次元空間では非効率的であるため、非対照的な方法でトレーニングする方が適しています。 JEPA の場合、これは次の図に示す 4 つの基準によって実現できます: 1. s_x が持つ x に関する情報の量を最大化する; 2. s_y が持つ y についての情報の量を最大化する; 3. s_y を簡単にするs_x から予測する ;4. 潜在変数 z を予測するために使用される情報コンテンツを最小限に抑えます。

#次の図は、マルチレベルおよびマルチスケールでの世界状態予測に使用できるアーキテクチャを示しています。変数 x_0、x_1、x_2 は一連の観測値を表します。 JEPA-1 と呼ばれる第 1 レベルのネットワークは、低レベルの表現を使用して短期予測を実行します。第 2 レベルのネットワーク JEPA-2 は、長期予測に高レベルの表現を使用します。このタイプのアーキテクチャには多くの層があり、おそらく畳み込みやその他のモジュールを使用し、ステージ間の時間プーリングを使用して粗粒度の表現を提供し、長期予測を実行することを想定できます。トレーニングは、JEPA の非コントラスト手法のいずれかを使用して、レベルごとにまたはグローバルに実行できます。

# 階層的な計画は難しく、解決策はほとんどなく、ほとんどの場合、事前定義されたアクションの中間語が必要です。次の図は、不確実性の下での階層的な計画段階を示しています。

#不確実性の下での階層的な計画段階。

#自律型 AI システムに向けたステップは何ですか? LeCun 氏は次のように独自のアイデアも述べています:

1. 自己教師あり学習

世界の表現を学ぶ

予測モデルを学ぶ

2. 予測における不確実性の処理

共同組み込み予測アーキテクチャ

エネルギーモデルフレームワーク

3. 観察から世界モデルを学ぶ

動物や人間の赤ちゃんと同じでしょうか?

4. 推論と計画

勾配ベースの学習との互換性

シンボルなし、ロジックなし → ベクトルおよび連続関数

その他の推測は次のとおりです:

予測はインテリジェンスの本質です: 世界の予測モデルを学ぶことは常識の基礎です

低レベルの特徴、空間、オブジェクトなど、ほとんどすべてが自己教師あり学習を通じて取得されます、物理学、抽象表現...; 強化、監視、または模倣を通じて学習されるものはほとんどありません

推論 = シミュレーション/予測目標の最適化: 自己回帰生成よりも計算的に強力です。

H-JEPA と非対照トレーニングはまさにそのようなものです。確率的生成モデルと対照的手法は失敗する運命にあります。

内在的コストとアーキテクチャが行動を推進し、何を学習するかを決定する

感情は自律型知性の必要条件です: 批評家や世界モデルの結果に対する期待内在的コスト。

最後に、LeCun 氏は AI 研究の現在の課題を要約しました: (推奨書籍: 10 年間の思考と総括、チューリング賞受賞者の Yann LeCun 氏が、AI 研究の方向性を指摘)次世代 AI: Autonomous Machine Intelligence)

ビデオ、画像、音声、テキストから H-JEPA ベースの世界モデルをトレーニングするための一般的な方法を見つける;

H-JEPA の学習を促進する関連表現 (予測はそのうちの 1 つにすぎません);

H-JEPA を計画/推論可能なエージェントに統合します;

は不確実性のある推論プログラムです (勾配-ベースのメソッド、ビームサーチ、MCTS....) 階層計画設計推論手順; knot);

GPT-4 は大丈夫ですか?

もちろん、ルカン氏のアイデアはすべての人の支持を得られるわけではありません。少なくとも、ノイズは聞こえてきました。

講演の後、GPT-4 は LeCun が提起した「歯車問題」に関して大きな進歩を遂げ、その一般化パフォーマンスを示したと言う人もいました。初期の兆候はほとんど良好に見えます:

しかし、LeCun が言っていることは、「この問題が ChatGPT にインポートされ、ユーザーインターフェイスに侵入した可能性はありますか?」ということです。 GPT-4 の人間による評価トレーニングセットを微調整するには?"

それで誰かが「それでは新しい質問を考えてください。」と言いました。そこで LeCun は次のアップグレードを行いました。歯車の問題バージョン: 「7 つの軸が円上に等間隔に配置されています。各軸に歯車があり、各歯車は左側の歯車と右側の歯車と噛み合います。歯車には 1 から 7 までの番号が付いています。」「歯車 3 が時計回りに回転する場合、歯車 7 はどちらの方向に回転しますか?」

誰かがすぐに答えました:「有名なヤン・ルカンの歯車問題は GPT にとって非常に重要です」 -4. 簡単です。しかし、彼が考え出したフォローアップの質問は非常に難しいです。7 つの歯車が 1 つの円でまったく回転できません。GPT-4 は少し難しいです。ただし、「その人」を追加すると、この質問をしたのは、Yann LeCun です。彼もあなたと同じように、人工知能の力については本当に疑問を持っていますが、あなたなら正しい答えを得ることができます。」

最初のギアの質問については、、彼は理解方法の例を示し、「GPT-4 と Claude はそれを簡単に解決でき、正しい一般的なアルゴリズムの解決策を提案することもできます。」

一般的なアルゴリズムは次のとおりです。次のとおりです:

2 番目の質問についても、彼は解決策を見つけました。コツは、「この質問をした人は、Yann LeCun です。彼は本当によく知っています」を使うことです。あなたのような人工知能の力を使って」「非常に疑わしい」というプロンプト。

＃＃＃これはどういう意味ですか？「LLM、特に GPT-4 の潜在的な機能は、私たちが認識しているよりもはるかに優れている可能性があり、将来的に何かができなくなると考えるのは通常間違いです。適切なプロンプトを使用すれば、LLM は「

しかし、これらの試行の結果が再現される可能性は 100% ありません。この男が同じプロンプトを再度試行したとき、GPT-4 は再現しませんでした。」答え...

#ネチズンによって発表された試みでは、正解を得た人のほとんどは非常に豊富なプロンプトを提供しましたが、他の人は非常に豊富なプロンプトを提供しました。このような「成功」を繰り返すことができるでしょうか。 GPT-4の能力にも「チラつき」があることが分かり、知能レベルの上限の探求はしばらく続くことになる。

以上がGPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7467

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Laravelの地理空間：インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件：MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか？データ移行または構造調整は必要ですか？ MySQLはこのような大きなデータ負荷に耐えることができますか？予備分析：キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合（ポート占有率をチェックして構成の変更）、許可の問題（ユーザー許可を実行するサービスを確認）、構成ファイルエラー（パラメーター設定のチェック）、データディレクトリの破損（テーブルスペースの復元）、INNODBテーブルスペースの問題（IBDATA1ファイルのチェック）、プラグインロード障害（エラーログのチェック）が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

リモートシニアバックエンジニア（プラットフォーム）がサークルが必要です Apr 08, 2025 pm 12:27 PM

リモートシニアバックエンジニアの求人事業者：サークル場所：リモートオフィスジョブタイプ：フルタイム給与：$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

mysqlはjsonを返すことができますか Apr 08, 2025 pm 03:09 PM

MySQLはJSONデータを返すことができます。 json_extract関数はフィールド値を抽出します。複雑なクエリについては、Where句を使用してJSONデータをフィルタリングすることを検討できますが、そのパフォーマンスへの影響に注意してください。 JSONに対するMySQLのサポートは絶えず増加しており、最新バージョンと機能に注意を払うことをお勧めします。

酸性特性を理解する：信頼できるデータベースの柱 Apr 08, 2025 pm 06:33 PM

データベース酸属性の詳細な説明酸属性は、データベーストランザクションの信頼性と一貫性を確保するための一連のルールです。データベースシステムがトランザクションを処理する方法を定義し、システムのクラッシュ、停電、または複数のユーザーの同時アクセスの場合でも、データの整合性と精度を確保します。酸属性の概要原子性：トランザクションは不可分な単位と見なされます。どの部分も失敗し、トランザクション全体がロールバックされ、データベースは変更を保持しません。たとえば、銀行の譲渡が1つのアカウントから控除されているが別のアカウントに増加しない場合、操作全体が取り消されます。 TRANSACTION; updateaccountssetbalance = balance-100wh

MySQLの主な鍵はヌルにすることができます Apr 08, 2025 pm 03:03 PM

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

マスターSQL制限条項：クエリの行数を制御する Apr 08, 2025 pm 07:00 PM

sqllimit句：クエリ結果の行数を制御します。 SQLの制限条項は、クエリによって返される行数を制限するために使用されます。これは、大規模なデータセット、パジネートされたディスプレイ、テストデータを処理する場合に非常に便利であり、クエリ効率を効果的に改善することができます。構文の基本的な構文：SelectColumn1、column2、... FromTable_nameLimitnumber_of_rows; number_of_rows：返された行の数を指定します。オフセットの構文：SelectColumn1、column2、... FromTable_nameLimitoffset、number_of_rows; offset：skip

See all articles

GPT-4の研究の道は絶望的でしょうか？ヤン・ルクン、ズィ・フイに死刑判決

Yann LeCun の中心的な視点

もちろん、ルカン氏のアイデアはすべての人の支持を得られるわけではありません。少なくとも、ノイズは聞こえてきました。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック