Meta Platforms 社の人工知能部門は最近、少量のトレーニング データのサポートを利用して AI モデルに物理世界の歩き方を学習させ、急速な進歩を遂げたと発表しました。
この研究により、AI モデルが視覚的なナビゲーション機能を獲得するまでの時間を大幅に短縮できます。以前は、このような目標を達成するには、大規模なデータセットを使用した「強化学習」を繰り返す必要がありました。
メタ AI 研究者らは、この AI ビジュアル ナビゲーションの探求は仮想世界に大きな影響を与えるだろうと述べています。このプロジェクトの基本的なアイデアは複雑ではありません。単純に観察と探索を通じて、AI が人間と同じように物理空間を移動できるようにするというものです。
メタ AI 部門は次のように説明しました。「たとえば、AR メガネに鍵を見つけるようガイドしてもらいたい場合、AI が不慣れで変化する環境のレイアウトを理解できるようにする方法を見つけなければなりません。結局のところ、これは非常に詳細で小規模な要件であるため、大量の計算能力を消費する高精度のプリセット マップに永久に依存することは不可能です。人間はコーヒー テーブルの正確な位置や長さを知る必要がなく、コーヒー テーブルの隅を簡単に移動できます。
この目的を達成するために、Meta は「身体化 AI」、つまり 3D シミュレーションのインタラクティブなメカニズムを通じて AI システムをトレーニングすることに注力することにしました。この分野でメタ社は、地図やGPSセンサーなしで新しい環境をナビゲートできる有望な「ポイントターゲットナビゲーションモデル」を確立したと述べた。
このモデルは視覚計測と呼ばれる技術を使用しており、AI が視覚入力に基づいて現在位置を追跡することができます。メタ氏は、このデータ拡張技術により、手動でデータに注釈を付ける必要がなく、効果的なニューラル モデルを迅速にトレーニングできると述べました。 Meta 氏はまた、自社の Habitat 2.0 を組み込んだ AI トレーニング プラットフォーム (Realistic PointNav ベンチマーク タスクを使用して仮想空間シミュレーションを実行する) でのテストを完了し、成功率は 94% であると述べました。
Meta 氏は次のように説明しました。「私たちの手法はデータセット内のすべてのシナリオを完全に解決したわけではありませんが、この研究は、現実世界の環境でナビゲートする能力が十分ではないことを最初に証明しました。必ず明示的なマッピングを実装する必要があります。」
マップに依存せずに AI ナビゲーション トレーニングをさらに改善するために、Meta は Habitat-Web と呼ばれるトレーニング データ セットを確立しました。これには、100,000 を超える異なるオブジェクトとゴールのナビゲーションが含まれています。人間が実証した手法。 Webブラウザ上で動作するHabitatシミュレーターはAmazon.comのMechanical Turkサービスにスムーズに接続でき、ユーザーは仮想ロボットを遠隔地から安全に操作できる。メタ氏は、得られたデータはAIエージェントが「最先端の結果」を達成するためのトレーニング資料として使用されると述べた。全体的な空間特性を理解するために部屋をスキャンしたり、隅に障害物があるかどうかを確認したりすることは、すべて AI が人間から学習できる効率的なオブジェクト検索動作です。
さらに、メタ AI チームは、ロボットが独自の「ゼロサンプル セット」を通じてさまざまなセマンティック ナビゲーション タスクや目標モードをナビゲートできるようにする、いわゆる「プラグ アンド プレイ」モジュール式アプローチも開発しました。体験学習フレームワーク」の一般化を実現。このようにして、AI エージェントはリソースを大量に消費するマップやトレーニングを必要とせずに基本的なナビゲーション スキルを習得でき、追加の調整を行わずに 3D 環境でさまざまなタスクを実行できます。
#メタは、これらのエージェントは画像ターゲットを継続的に検索するように訓練されていると説明しています。彼らは環境内のランダムな場所で撮影された写真を受け取り、自律ナビゲーションを使用してその場所を見つけようとします。メタ研究者らは、「我々の手法はトレーニングデータを1/12.5に削減し、最新の転移学習技術よりも成功率が14%高い」と述べた
Constellation Researchのアナリスト、ホルガー・ミュラー氏はインタビューでZhong氏は次のように述べた。メタのこの最新の開発は、メタバース開発計画において重要な役割を果たすことが期待されています。彼は、将来的に仮想世界が標準になるのであれば、AI はこの新しい空間を理解できる必要があり、理解するためのコストはそれほど高くないと考えています。
Mueller 氏はさらに、「AI の物理世界を理解する能力は、ソフトウェアベースの方法によって拡張する必要があります。Meta は現在この道を進んでおり、トレーニングを必要としない AI を開発するなど、身体化された AI において進歩を遂げています。」と付け加えました。 「周囲の環境を自律的に理解できるソフトウェア。これが早期に実用化されるのを楽しみにしています。」
これらの実際の使用例は、私たちからそう遠くないかもしれません。メタ氏は、次のステップは、これらの結果をナビゲーションからモバイル操作に発展させ、特定のタスク(ウォレットを識別して所有者に返すなど)を実行できるAIエージェントを開発することだと述べた。
以上がメタ研究者が AI の新たな試みを行う:地図やトレーニングなしで物理的に移動するようにロボットに教えるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。