OpenAI の共同創設者である Andrej Karpathy 氏は最近、開発者イベントで短いスピーチを行い、AI エージェント (人工知能エージェント) に関する彼と OpenAI の内部の見解について語りました。
Andrej Karpathy 氏は、過去の AI エージェント開発の難しさと、新しいテクノロジー ツールによって生み出された新たな機会を比較し、テスラでの仕事は「自動運転に気を取られていた」と冗談を言いました。どちらも悪い AI エージェントの例です。
新しい機会に関して、アンドレイ・カルパシー氏は、ディープラーニングの初期に起こったことと同じように、今こそ再び神経科学に戻り、そこからインスピレーションを求める時期だと信じています。
一方、Andrej Karpathy 氏は、AI エージェントの構築においては、一般の人々、起業家、オタクが OpenAI のような企業よりも有利であると信じています。現在、誰もが平等な立場で競争しているため、この分野での進歩を見ることを楽しみにしています。 。 結果。
彼はまた、ある論文が別のトレーニング方法を提案すると、OpenAI の内部 Slack はそれをすべて自分たちの残したものだと考えて冷笑するだろうとも明らかにしました。彼らは、AI エージェントに関する最新の論文について非常に興味深く議論します。
以下はこの共有の全文です:
###こんにちは、みんな。私は、AI エージェントのテーマについて、やる気を起こさせる言葉を話すよう招待されました。 AI エージェントはある意味、私にとても近い存在だと思います。話を始めましょう。これは非常に初期の OpenAI の話です。当時、OpenAI にはおそらく十数人しかいませんでした。2016 年頃、当時、Theトレンドは実際には RL エージェント (強化学習エージェント) です。
誰もがエージェントの構築に非常に興味を持っていましたが、当時は主にゲームに基づいており、興奮は Atari のようなゲーム会社を中心にしていて、当時 OpenAI で行っていた私のプロジェクトは RL エージェントの使用に焦点を当てようとしていたのです。ゲームではなく、コンピューター上でプレイするためのキーボードとマウス。
私はそれらをもっと便利にして、たくさんの仕事をしたいと思い、プロジェクトは World of Bits と呼ばれました。
数人の同僚と私はついに論文を発表しました。この論文は本質的に RL 強化学習手法に基づいているため、驚くべきものではありません。私たちのウェブページは非常にシンプルで、ユーザーは簡単に航空券を予約したり、食べ物を注文したりできます。
テクノロジーはまだ準備が整っておらず、現時点でこれらのことを行うのは賢明ではないため、これらすべては明らかに実現不可能です。
AI エージェントのことは完全に忘れて、言語モデルを実行する必要があることがわかりました。
私たちは 5 年後にここに戻ってきました。自動運転に少し気を取られていましたが、今では AI エージェントが再びクールになり、私たちのツールボックスはまったく異なり、これらの問題へのアプローチ方法もまったく異なります。 。
実際のところ、皆さんは AI エージェントに関する研究を行ったことはありますが、強化学習手法については研究したことがないかもしれません。クレイジーだし、当時はこんなことは予想できなかったと思います。これはとても楽しいです。
AI エージェントがなぜこれほど人気があるのかについて少しお話しさせてください。 AGI (汎用人工知能) が 1 つだけではなく多数の AI エージェントの機能を最大限に活用することは、多くの人にとって明らかだと思います。おそらく、デジタルエンティティの組織や文明が存在するでしょう。それは非常に刺激的であり、少しクレイジーですらあると思います。
しかし、これには水を差したいとも思います。私の意見では、頭の中で考えて実証するのは簡単でも、実際の製品に変えるのは非常に難しいクラスの問題があります。多くのものがこれに当てはまりますが、自動運転などがその一例だと思います。
自動運転を想像し、街区内を走行するためのデモカーを構築するのは簡単ですが、それを製品化するには 10 年かかります。同様に、VR についても同じことが言えると思います。実現するには 10 年かかります。
AIエージェントにもある程度同じことが当てはまると思います。それを想像すると興奮するのは簡単ですが、実際に機能させるには 10 年かかると思います。
私が言いたかったもう一つのことは、今、神経科学に戻って、ある意味で再び神経科学からインスピレーションを受けるのは興味深いことだと思います。ディープラーニングの初期の頃は神経科学からインスピレーションを受けていました。
これらの関係について考えるのは非常に興味深いです。特に、多くの人が解決策の一部として言語モデルに注目していると思うからです。しかし、人間のすべての認知能力を備えた完全なデジタル エンティティを構築するにはどうすればよいですか? ?
私たちが行っている活動を計画し、考え、反映するための基礎となるシステムが必要であるということに誰もが同意することに疑いの余地はありません。ここで神経科学が重要な役割を果たします。
たとえば、海馬は非常に重要ですが、AI エージェントでは、記憶の保存やマークの検索などの機能を実現する海馬の役割は何ですか?
視覚野と聴覚野の構築方法については予備的に理解していますが、AI エージェントにはまだ不明な点がたくさんあります。
たとえば、AI エージェントではビジュアル ゲームはどのように見えるのでしょうか?潜在意識の座である視床は、AI エージェントでは何に相当しますか?
これはとても興味深いですね。実は今日は神経科学の本、デイビッド・イーグルマン著『脳と行動』を持ってきましたが、とても興味深く啓発的でした。
おそらく今、私たちは神経科学に興味深いインスピレーションを求めて、以前と同じように個々のニューロンを再設計する必要があるでしょう。
最後に励ましの言葉で終わりたいと思います。興味深いですが、明白ではないのは、あなたが構築した AI エージェント (視聴者を指します) は、実際には現代の AI エージェント機能の最前線にあるということです。OpenAI、DeFi などのすべての大規模な LLM 機関は、そうではないのではないかと思います。最前線。
あなたは最前線にいます。
たとえば、OpenAI は、Transformer の大規模言語モデルのトレーニングに非常に優れています。論文で別のトレーニング方法が提案されている場合、社内の OpenAI Slack グループでの議論は、「ああ、誰かがそれを 2 年半試したがうまくいかなかった、そして私たちはこれについて何も知らない」というようなものになるでしょう。私はその詳細をよく知っています。
しかし、新しい AI エージェントの論文が発表されると、私たちは皆非常に興味を持ち、それが非常にクールだと思います。なぜなら、私たちのチームはそれに 5 年も費やしていないからです。私たちはあなた以上に何も知りません。私たちはやっているのです。皆さんと一緒に競い合いましょう。
これが、あなたが AI エージェント機能の最前線にいると思う理由です。これは AI エージェントの開発にとって非常に重要です。
以上がOpenAI マスター Karpathy の最新情報: OpenAI が AI エージェントに最も興味を持っている理由の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。