AI は他に人間の予想を超えたタスクを実行できますか?最近、Nvidia の人工知能研究者は、AI のより複雑な機能を調査するために、言語モデル GPT-4 をサンドボックス ゲーム「Minecraft」に導入しました。
5 月 25 日、NVIDIA チームとカリフォルニア工科大学を含む多くの大学の研究者が Voyager をリリースしました。論文の定義によれば、Voyager は大規模な言語モデルを備えたオープンな表現エージェントです。自由度の高いビデオゲーム「Minecraft」。
AIによるゲーム内でのさまざまな操作
ボイジャーに与えられた任務は、生存、戦闘、建設など、ゲーム内のさまざまな目標を達成し、ゲーム時間と経験の蓄積によって徐々にスキルを向上させることです。
システムがこの目標を生成すると、GPT-4 は目標を達成するために必要なコードを自動的に生成し、キャラクターが対応するアクションを完了できるようにします。
このプロジェクトの最も革新的な部分は、ゲーム キャラクターを動作させるコードを GPT-4 を使用して生成していることです。AI の実装ロジックは人間と同じです。最初に試みるときは必ず失敗します。タスクですが、エラー情報とゲームプレイのフィードバックを収集して、コードを状況に適応させ、最終的にミッションを完了します。
ゲーム時間が長くなるにつれて、Voyager はゲーム内のさまざまな小道具をより迅速に構築するために独自のコード ベースを確立しました。この動作は、AI が独自のゲーム エクスペリエンスを蓄積していると理解することもできます。研究者らはボイジャーのゲームの進行状況を他の人工知能エージェントと比較したところ、ボイジャーは他のAIエージェントに比べて3倍のアイテムを獲得し、探索距離やアイテムの構築速度も他の対照群よりもはるかに優れていたことが判明した。
同時に、ボイジャーは初めてダイヤモンドの剣を製造しました
GPT-4 のテストの場として「Minecraft」が選ばれた理由は、このゲームが自由度が高く、目的が明確すぎないためです。人間のプレーヤーと同様の能力を見つけるために、研究者たちはいくつかの重要なスキルを要約しました。
たとえば、「現在のスキル レベルと世界の状態に基づいて適切なタスクを提案する」 - 砂漠にいる場合、AI は鉄鉱石の代わりにサボテンを収集することを最初に検討します。もう 1 つの例は、「環境フィードバックに基づいてスキルを向上させ、習得したスキルをメモリに保存する」です。敵としてのゾンビはクモに似ているため、ゾンビとの戦いで得た戦闘経験をクモに使用できます。
もちろん、AI にゲームのプレイを教えるという最終的な目標は、ゲームの外にあります。研究者らは、この方法で言語モデルをトレーニングすることにより、将来的には日常のオフィス タスクの多くが自動化されるか、ユーザーのニーズに基づいて自動化される可能性があると述べています。特定の効果を自動的に実現します。
ただし、明るい見通しとは裏腹に、この実験はまだ初期段階にあり、本当に面倒な作業をAIに任せたいのであれば、しばらく待たなければならないかもしれません。
参考:https://voyager.minedojo.org/
以上がGPT-4 を「Minecraft」に接続することで、科学者は AI の新たな可能性を発見していますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。