Google の DeepMind は 6 月 26 日、同社がさまざまなロボット アームを制御して一連のタスクを実行できる RoboCat と呼ばれる人工知能モデルを開発したと発表しました。これだけでは特に目新しいことではないが、DeepMind によれば、このモデルはさまざまなタスクを解決して適応することができ、現実世界のさまざまなロボットを使用してそれを行うことができる初めてのモデルであるという。
RoboCat は、テキスト、画像、イベントを分析および処理できる別の DeepMind AI モデルである Gato からインスピレーションを受けました。 RoboCat のトレーニング データには、仮想環境の他のロボット制御モデル、人間が制御するロボット、および RoboCat 自体の以前のバージョンから派生した、シミュレートされた実際のロボットの画像と動作データが含まれます。
DeepMind の研究科学者であり、RoboCat チームの共同研究者の 1 人である Alex Lee 氏は TechCrunch との電子メールインタビューで次のように述べています。「単一の大きなモデルが複数の実世界のモデルで使用できることを示しました。このロボットは、さまざまなタスクを物理的に解決し、新しいタスクやエンティティにすぐに適応できます。」
IT House は、RoboCat を訓練するために、DeepMind の研究者は最初に人間が制御するロボット アームを使用し、それぞれのロボット アームを 100 ~ 1000 回デモンストレーションしたと述べました。タスクまたはロボットは、シミュレートされた環境または実際の環境で収集されました。たとえば、ロボット アームに歯車を拾わせたり、積み木を積んだりしてみましょう。次に、RoboCat を微調整し、各タスクに特化した「派生」モデルを作成し、平均 10,000 回練習させました。派生モデルとデモンストレーション データによって生成されたデータを活用することで、研究者は RoboCat のトレーニング データ セットを拡張し、新しいバージョンの RoboCat をトレーニングし続けています。
RoboCat の最終バージョンは、シミュレーションと現実世界の両方で、合計 253 のタスクでトレーニングされ、これらのタスクの 141 のバリエーションでテストされました。 DeepMindは、RoboCatが数時間にわたって収集された人間が制御する1,000個のデモンストレーションを観察した後、さまざまなタイプのロボットアームの操作を学習したと主張している。 RoboCat は 2 本指のアームを備えた 4 台のロボットで訓練されていますが、モデルは 3 本指のグリッパーと 2 倍の制御可能な入力を備えたより複雑なアームに適応することができました。
これにもかかわらず、DeepMind のテストでは、さまざまなタスクにおける RoboCat の成功率は、最低 13% から最高 99% まで大きく異なりました。これはトレーニング データ内の 1000 件のデモンストレーションを使用したもので、デモンストレーションの数が半分になると、それに応じて成功率も低下します。ただし、場合によっては、RoboCat はわずか 100 回のデモンストレーションを観察するだけで新しいタスクを学習できると DeepMind は主張しています。
Alex Lee は、RoboCat によって新しいタスクの解決が容易になる可能性があると考えています。 「新しいタスクのデモンストレーションを一定数行うと、RoboCat は新しいタスクに合わせて微調整し、より多くのデータを自己生成してさらに改善することができます」と彼は付け加えました。
研究チームは今後、RoboCatに新しいタスクを完了するよう教えるために必要なデモンストレーションの数を10回未満に減らすことを目指しています。
以上がGoogle の DeepMind は、さまざまなロボットを制御して一連のタスクを実行できる RoboCat AI モデルを開発しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。