OpenAI マスター Karpathy の最新情報: OpenAI が AI エージェントに最も興味を持っている理由
OpenAI の共同創設者である Andrej Karpathy 氏は最近、開発者イベントで短いスピーチを行い、AI エージェント (人工知能エージェント) に関する彼と OpenAI の内部の見解について語りました。
Andrej Karpathy 氏は、過去の AI エージェント開発の難しさと、新しいテクノロジー ツールによって生み出された新たな機会を比較し、テスラでの仕事は「自動運転に気を取られていた」と冗談を言いました。どちらも悪い AI エージェントの例です。
新しい機会に関して、アンドレイ・カルパシー氏は、ディープラーニングの初期に起こったことと同じように、今こそ再び神経科学に戻り、そこからインスピレーションを求める時期だと信じています。
一方、Andrej Karpathy 氏は、AI エージェントの構築においては、一般の人々、起業家、オタクが OpenAI のような企業よりも有利であると信じています。現在、誰もが平等な立場で競争しているため、この分野での進歩を見ることを楽しみにしています。 。 結果。
彼はまた、ある論文が別のトレーニング方法を提案すると、OpenAI の内部 Slack はそれをすべて自分たちの残したものだと考えて冷笑するだろうとも明らかにしました。彼らは、AI エージェントに関する最新の論文について非常に興味深く議論します。
以下はこの共有の全文です:
###こんにちは、みんな。私は、AI エージェントのテーマについて、やる気を起こさせる言葉を話すよう招待されました。 AI エージェントはある意味、私にとても近い存在だと思います。話を始めましょう。これは非常に初期の OpenAI の話です。当時、OpenAI にはおそらく十数人しかいませんでした。2016 年頃、当時、Theトレンドは実際には RL エージェント (強化学習エージェント) です。
誰もがエージェントの構築に非常に興味を持っていましたが、当時は主にゲームに基づいており、興奮は Atari のようなゲーム会社を中心にしていて、当時 OpenAI で行っていた私のプロジェクトは RL エージェントの使用に焦点を当てようとしていたのです。ゲームではなく、コンピューター上でプレイするためのキーボードとマウス。
私はそれらをもっと便利にして、たくさんの仕事をしたいと思い、プロジェクトは World of Bits と呼ばれました。
数人の同僚と私はついに論文を発表しました。この論文は本質的に RL 強化学習手法に基づいているため、驚くべきものではありません。私たちのウェブページは非常にシンプルで、ユーザーは簡単に航空券を予約したり、食べ物を注文したりできます。
テクノロジーはまだ準備が整っておらず、現時点でこれらのことを行うのは賢明ではないため、これらすべては明らかに実現不可能です。
AI エージェントのことは完全に忘れて、言語モデルを実行する必要があることがわかりました。
私たちは 5 年後にここに戻ってきました。自動運転に少し気を取られていましたが、今では AI エージェントが再びクールになり、私たちのツールボックスはまったく異なり、これらの問題へのアプローチ方法もまったく異なります。 。
実際のところ、皆さんは AI エージェントに関する研究を行ったことはありますが、強化学習手法については研究したことがないかもしれません。クレイジーだし、当時はこんなことは予想できなかったと思います。これはとても楽しいです。
AI エージェントがなぜこれほど人気があるのかについて少しお話しさせてください。 AGI (汎用人工知能) が 1 つだけではなく多数の AI エージェントの機能を最大限に活用することは、多くの人にとって明らかだと思います。おそらく、デジタルエンティティの組織や文明が存在するでしょう。それは非常に刺激的であり、少しクレイジーですらあると思います。
しかし、これには水を差したいとも思います。私の意見では、頭の中で考えて実証するのは簡単でも、実際の製品に変えるのは非常に難しいクラスの問題があります。多くのものがこれに当てはまりますが、自動運転などがその一例だと思います。
自動運転を想像し、街区内を走行するためのデモカーを構築するのは簡単ですが、それを製品化するには 10 年かかります。同様に、VR についても同じことが言えると思います。実現するには 10 年かかります。
AIエージェントにもある程度同じことが当てはまると思います。それを想像すると興奮するのは簡単ですが、実際に機能させるには 10 年かかると思います。
私が言いたかったもう一つのことは、今、神経科学に戻って、ある意味で再び神経科学からインスピレーションを受けるのは興味深いことだと思います。ディープラーニングの初期の頃は神経科学からインスピレーションを受けていました。
これらの関係について考えるのは非常に興味深いです。特に、多くの人が解決策の一部として言語モデルに注目していると思うからです。しかし、人間のすべての認知能力を備えた完全なデジタル エンティティを構築するにはどうすればよいですか? ?
私たちが行っている活動を計画し、考え、反映するための基礎となるシステムが必要であるということに誰もが同意することに疑いの余地はありません。ここで神経科学が重要な役割を果たします。
たとえば、海馬は非常に重要ですが、AI エージェントでは、記憶の保存やマークの検索などの機能を実現する海馬の役割は何ですか?
視覚野と聴覚野の構築方法については予備的に理解していますが、AI エージェントにはまだ不明な点がたくさんあります。
たとえば、AI エージェントではビジュアル ゲームはどのように見えるのでしょうか?潜在意識の座である視床は、AI エージェントでは何に相当しますか?
これはとても興味深いですね。実は今日は神経科学の本、デイビッド・イーグルマン著『脳と行動』を持ってきましたが、とても興味深く啓発的でした。
おそらく今、私たちは神経科学に興味深いインスピレーションを求めて、以前と同じように個々のニューロンを再設計する必要があるでしょう。
最後に励ましの言葉で終わりたいと思います。興味深いですが、明白ではないのは、あなたが構築した AI エージェント (視聴者を指します) は、実際には現代の AI エージェント機能の最前線にあるということです。OpenAI、DeFi などのすべての大規模な LLM 機関は、そうではないのではないかと思います。最前線。
あなたは最前線にいます。
たとえば、OpenAI は、Transformer の大規模言語モデルのトレーニングに非常に優れています。論文で別のトレーニング方法が提案されている場合、社内の OpenAI Slack グループでの議論は、「ああ、誰かがそれを 2 年半試したがうまくいかなかった、そして私たちはこれについて何も知らない」というようなものになるでしょう。私はその詳細をよく知っています。
しかし、新しい AI エージェントの論文が発表されると、私たちは皆非常に興味を持ち、それが非常にクールだと思います。なぜなら、私たちのチームはそれに 5 年も費やしていないからです。私たちはあなた以上に何も知りません。私たちはやっているのです。皆さんと一緒に競い合いましょう。
これが、あなたが AI エージェント機能の最前線にいると思う理由です。これは AI エージェントの開発にとって非常に重要です。
以上がOpenAI マスター Karpathy の最新情報: OpenAI が AI エージェントに最も興味を持っている理由の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

ファルコン3:革新的なオープンソースの大規模な言語モデル LLMSの称賛されたFalconシリーズの最新のイテレーションであるFalcon 3は、AIテクノロジーの重要な進歩を表しています。 Technology Innovation Institute(TII)によって開発されたこのオープン

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。

2024年は、コンテンツ生成にLLMSを使用することから、内部の仕組みを理解することへの移行を目撃しました。 この調査は、AIエージェントの発見につながりました。これは、最小限の人間の介入でタスクと決定を処理する自律システムを処理しました。 buildin
