ホームページ テクノロジー周辺機器 AI バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

Feb 01, 2024 am 09:48 AM
業界 ロボット技術 fmb 機能制御

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

#人工知能とロボット技術の急速な発展に伴い、ロボット工学における機能操作の重要性がますます顕著になってきています。従来のベンチマーク テストでは、複雑な操作タスクに対するロボットの現在のニーズを満たすことができなくなり、新しい操作ベンチマーク (機能操作ベンチマーク) の出現が求められています。

概要

ロボット制御は 2 つの主要な課題に直面しています: ロボットがどのようにインテリジェントに複雑に対処するか接触のダイナミクスと、環境や物の多様性にどのように対応するか。これらの課題に対して、ロボット学習技術が重要な解決策として注目されています。したがって、この分野には、困難な現実世界のタスク、高品質のデータ、簡単に複製可能な設定、およびベースライン結果を統合する関連手法を提供する、包括的でアクセスしやすいフレームワークが必要です。このフレームワークに基づいて、研究者は提案されたタスクについて実験を行うことができます。徹底的な分析。

カリフォルニア大学バークレー校のロボティクス インテリジェント研究所 (RAIL) の研究チームは、FMB (Functional Manipulation Benchmark for Generalizable) と呼ばれる、前述のような現実世界のベンチマークを提案しました。ロボット学習)。

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

  • プロジェクトのホームページ: https://function-manipulation-benchmark.github.io/
  • 論文アドレス: https://arxiv.org/abs/2401.08553
  • 論文タイトル: FMB: 一般化可能なロボット学習のための関数操作ベンチマーク
  • 共同筆頭著者のホームページ: https://people.eecs.berkeley.edu/~jianlanluo/
  • https://charlesxu0124.github.io/

FMB には次の特徴があります。

  • 革新的なデザイン: 3D プリンティング技術を使用して製造タスク内のオブジェクトはロボットの汎化能力をテストするために使用され、この方法は他の研究者も簡単に再現できます。
  • 多様なタスク: 単一オブジェクトおよび複数オブジェクトの多段階操作タスクを含み、日常環境における課題を真にシミュレートします。
  • 大規模なデータセット: 多数の人によるデモンストレーションを通じて、ロボットには豊富なデータセットが提供されます。
  • 模倣学習ベースライン: 最先端の機械学習手法を使用して、ベースライン結果とモジュール式コンポーネントが他の研究者による使用のために提供されます。

#オブジェクトとタスク

FMB のタスクは次のとおりです。単一オブジェクトのマルチステップ操作タスクと、複数オブジェクトのマルチステップ操作タスクの 2 つのカテゴリに大別されます。これらのタスクは、タスク全体を完了するために必要な、把握、位置変更、組み立てなどのロボットの基本スキルをテストするように設計されています。 FMB のタスクでは、ロボットが単一の制御スキルを完了するだけでなく、ロボットがこれらのスキルを組み合わせて、より複雑な複数ステップのタスクを完了することも要求されます。

FMB のタスク設計は柔軟で変更可能です。研究者は、必要に応じて 1 つのスキルに焦点を当てることも、ロボットの制御機能を詳しく研究することも、複数ステップのタスク全体を研究することもできます。これには、ロボット側での長期的な計画と、障害から回復する能力が必要です。より複雑なマルチステップタスクでは、適切なオブジェクトを選択し、それらを操作する順序について推論する必要があるため、ロボットは複雑なリアルタイムの決定を行う必要があります。

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

#

大規模なデータセット

ロボット学習のプロセスにおいて、データの役割を過小評価することはできません。ロボットが複雑なタスクをよりよく理解して習得できるようにするために、研究チームは、上記のタスクをカバーする、20,000 以上の操作軌跡を含む大規模な専門家による人間によるデモンストレーション データ セットを収集しました。研究チームはこれらのデモンストレーションデータを記録するために4台の異なるカメラを使用し、そのうちの2台はロボットの手首に取り付けられ、そのうちの2台は全体的な視点を提供しました。これらのカメラは、ロボットがタスクを解決する方法を学習するために重要な RGB カラー画像情報、深度情報などのデータをキャプチャします。

さらに、データセットにはロボットのエンドエフェクターの力/トルク情報も記録されます。これは、多数の物体との接触が必要な組み立てなどの作業にとって非常に重要です。 。この豊富なデータを通じて、ロボットはタスクのあらゆる詳細を深く理解し、人間の操作スキルをより正確に模倣することができます。データの深さと広さこそが、ロボット学習の強固な基盤となるのです。これにより、ロボットは複雑なタスクを実行する際に、より人間らしく、器用にタスクに応答できるようになります。

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

#模倣学習ベースライン

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

ベースライン戦略のアーキテクチャ図。

Transformer と ResNet に基づく両方のモデルは、共有重みを持つ ResNet エンコーダーを使用して各画像ビューをエンコードし、それを固有受容情報と組み合わせて選択可能ですオブジェクトは、対応するロボット スキルのエンコーディング機能と組み合わされて、7 自由度のアクションを予測します。

#FMB の実験部分では、模倣学習システムのパフォーマンスに関する一連のテストを実施し、さまざまな学習方法を比較し、さまざまな入力モードと設計上の決定の影響を調査します。実験の結果、深さ情報を使用すると把握戦略の有効性が向上し、力/トルク情報は組み立て作業にとって非常に重要であることがわかりました。マルチステップタスクの場合、従来の ResNet、Transformer、および Diffusion 手法は失敗しましたが、この論文で提案された階層制御手法は可能性を示しています。

#クロールタスク

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない実験結果は、深さ情報を組み込んだ ResNet 戦略が有効であることを示しています。クロール タスクのパフォーマンスは、RGB 情報のみを使用する戦略よりも一貫して優れています。データ削減の研究を通じて、研究チームは、さまざまな量のトレーニング データがクローリング タスクのパフォーマンスに与える影響を調査しました。この結果は、認識されたオブジェクトを処理するときに深度情報を組み込む ResNet 戦略のパフォーマンスが、トレーニング データの量が増加するにつれて向上することを示しています。特に、この戦略は、目に見えないオブジェクトに対して、見えているオブジェクトと同様のパフォーマンスを示し、トレーニング オブジェクトの多様性がロボットの汎化能力に大きく寄与していることを示しています。


組立作業

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない組立作業における力/トルク情報の重要性確認済み。力/トルク情報は、物体がターゲット表面に接触したかどうかを判断し、探索などのアクションを効果的に実行するためにロボットが採用する戦略にとって非常に重要です。

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない#ただし、ポリシーがすべてのオブジェクトに対してトレーニングされている場合、ロボットが常に組み立てタスクを正常に完了できるとは限りません。これは、戦略ではまずオブジェクトをどの穴にはめ込むかを決定し、次に対応するアクションを生成する必要があり、タスクの複雑さが大幅に増加するためです。この問題を解決するために、研究チームは、戦略が組み立てる必要があるオブジェクトの形状を決定できるようにするオブジェクト選択メカニズムを戦略に追加し、それによって正しい組み立てアクションを生成することに重点を置きました。


#複数ステップのタスク
FMB のフレームワークには 2 つの複雑なタスクが含まれています。これらの複雑なタスクでは、ロボットが人間と同じように複数のステップを連続して完了できる必要があります。以前の方法はロボットにプロセス全体を学習させることでしたが、この方法では単一のリンクでのエラーによりエラーが蓄積し、最終的にはタスク全体の失敗につながる傾向がありました。このアプローチの成功率は、単一オブジェクト操作タスクと複数オブジェクト操作タスクの両方で 0/10 です。

累積エラーの問題に対処するために、研究チームは階層型制御戦略を採用しました。階層戦略により、タスクがいくつかの小さな部分に分解されます。完成した各部分は、決定点を通過することに相当します。エラーが発生した場合でも、後続のリンクへの影響を回避するために、すぐに修正できます。たとえば、ロボットが物体を掴む際に確実に掴むことができなかった場合、成功するまで試行を続けます。

研究チームは 2 つの階層的アプローチをテストしました。1 つ目は単一ポリシーのタスク タイプを示す有効なベクトルを提供し、2 つ目はそれぞれのポリシーを提供します。制御スキルは個別にトレーニングされます。どちらもオペレーターの指示を上位レベルの戦略として使用し、異なる戦略を使用してテストを行ったところ、研究チームは両方の方法が良好に機能したことを発見しました。

テスト結果は、複雑なロボットタスクの処理における階層的アプローチの有効性を示し、将来の研究に新たな方向性を提供します。

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

#上の図に示すように、ロボットは学習後、自律的に機能制御を実行できます。

バークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくない

全体として、上記の実験は、ロボット学習分野における研究チームの技術革新を実証し、FMB が高度なロボット学習方法の開発に適したベンチマークであることも検証しました。 。研究チームは、FMBに基づくロボット学習の限界をさらに押し上げることができる将来の研究を楽しみにしています。

以上がバークレーのオープンソース高品質大規模ロボット制御ベンチマーク、複雑な自律制御タスクに直面するのはもはや難しくないの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました Aug 09, 2024 pm 04:01 PM

でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した 初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した Aug 21, 2024 pm 07:33 PM

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう Sep 02, 2024 pm 01:56 PM

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました 世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました Aug 22, 2024 pm 10:35 PM

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Sep 03, 2024 pm 05:18 PM

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件(未発表2件)、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました 宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました Aug 08, 2024 am 07:02 AM

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

中国初の大型UIモデル登場! Motiff の大規模モデルはデザイナーにとって最適なアシスタントを作成し、UI デザインのワークフローを最適化します 中国初の大型UIモデル登場! Motiff の大規模モデルはデザイナーにとって最適なアシスタントを作成し、UI デザインのワークフローを最適化します Aug 19, 2024 pm 04:48 PM

人工知能は想像を超えるスピードで発展しています。 GPT-4 がマルチモーダル技術を一般に公開して以来、マルチモーダル大型モデルは急速な開発段階に入り、純粋なモデルの研究開発から垂直分野での探査と応用へと徐々に移行し、あらゆる分野に深く統合されています。インターフェイス インタラクションの分野では、Google や Apple などの国際的なテクノロジー大手が、携帯電話 AI 革命を前進させる唯一の方法とみなされている大規模なマルチモーダル UI モデルの研究開発に投資してきました。このような状況の中で、中国初の大規模UIモデルが誕生しました。 8月17日、国際エクスペリエンスデザインカンファレンス「IXDC2024」において、AI時代のデザインツールであるMotiffは、独自開発したUIマルチモーダルモデル「Motiff Model」を発表した。世界初のUIデザインツールです

See all articles