ホームページ テクノロジー周辺機器 AI 20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

Feb 21, 2024 pm 03:31 PM
ロボット 強化学習 業界 ロボット技術 serl

ロボットは工場の正確な制御タスクを学習できるようになりました。
20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です#近年、四足歩行などロボットの強化学習技術の分野で大きな進歩が見られます。 、把握、器用さ、制御などですが、それらのほとんどは実験室での実証段階に限定されています。ロボット強化学習テクノロジーを実際の運用環境に広く適用するには、依然として多くの課題があり、実際のシナリオでの適用範囲がある程度制限されます。強化学習技術の実用化の過程では、報酬メカニズムの設定、環境のリセット、サンプル効率の向上、行動の安全性の保証など、複数の複雑な問題を克服する必要があります。業界の専門家は、強化学習テクノロジーの実際の実装における多くの問題を解決することは、アルゴリズム自体の継続的な革新と同じくらい重要であると強調しています。

この課題に直面して、カリフォルニア大学バークレー校、スタンフォード大学、ワシントン大学、Google の学者は、Efficient Robot Reinforcement Learning Suite と呼ばれるツールを共同開発しました。 (SERL). 実際のロボット応用における強化学習テクノロジーの普及促進に特化したオープンソース ソフトウェア フレームワーク。

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

  • プロジェクトのホームページ: https://serl-robot.github.io/
  • オープンソース コード: https://github.com/rail- berkeley /serl
  • ##論文のタイトル: SERL: サンプル効率的なロボット強化学習のためのソフトウェア スイート

SERL フレームワークには主に次のコンポーネントが含まれています:

1. 効率的な強化学習

強化学習の分野、インテリジェンス エージェント (ロボットなど) は、環境と対話することでタスクの実行方法を学習します。さまざまな行動を試し、行動の結果に基づいて報酬シグナルを取得することで、累積報酬を最大化するように設計された一連の戦略を学習します。 SERL は RLPD アルゴリズムを使用して、ロボットがリアルタイムのインタラクションと以前に収集されたオフライン データから同時に学習できるようにし、ロボットが新しいスキルを習得するのに必要なトレーニング時間を大幅に短縮します。

2. さまざまな報酬規定方法

SERL はさまざまな報酬規定方法を提供し、開発者が報酬を調整できるようにします。特定のタスクのニーズに合わせた構造。たとえば、固定位置の設置タスクではロボットの位置に合わせた報酬を得ることができ、より複雑なタスクでは分類器や VICE を使用して正確な報酬メカニズムを学習できます。この柔軟性は、ロボットが特定のタスクに対して最も効果的な戦略を学習できるように正確に導くのに役立ちます。

3. 再現機能なし

従来のロボット学習アルゴリズムは定期的に環境をリセットする必要があり、次のように処理します。インタラクティブな学習のラウンド。多くのタスクでは、これを自動的に行うことはできません。 SERL が提供する非強化学習機能は、前方ポリシーと後方ポリシーの両方を同時にトレーニングし、相互に環境をリセットします。

4. ロボット制御インターフェイス

SERL は、標準例として Franka マニピュレーター タスク用の一連のジム環境インターフェイスを提供します。 、ユーザーは SERL をさまざまなロボット アームに簡単に拡張できます。

#5. インピーダンス コントローラー

ロボットが安全かつ正確に探索および操作できるようにするために、 SERL は、外部物体との接触後に過剰なトルクが発生しないようにしながら精度を確保するために、Franka ロボット アーム用の特別なインピーダンス コントローラーを提供します。

これらのテクノロジーと手法を組み合わせることで、SERL は高い成功率と堅牢性を維持しながらトレーニング時間を大幅に短縮し、ロボットが短時間で複雑なタスクを学習できるようにします。そしてそれらを現実の世界で効果的に適用します。

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です図 1 と 2: さまざまなタスクにおける SERL と動作クローニング手法の間の成功率とビート数の比較。同じ量のデータでは、SERL の成功率はクローンの成功率の数倍 (最大 10 倍) 高く、ビート レートは少なくとも 2 倍です。

アプリケーション ケース

1. PCB コンポーネント アセンブリ:

PCB ボード上で穴あきコンポーネントを組み立てるのは一般的ですが、困難なロボット作業です。電子部品のピンは非常に曲がりやすく、穴の位置とピンとの公差が非常に小さいため、ロボットの組み立てには正確かつ丁寧な作業が求められます。 SERL は、わずか 21 分間の自律学習で、ロボットが 100% のタスク完了率を達成することを可能にしました。基板の位置が動いたり、視線が部分的に遮られるなどの未知の干渉があっても、ロボットは安定して組立作業を完了することができます。

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

#

3、4、5: 回路基板コンポーネントのミッションを取り付けるとき、ロボットはトレーニング段階では遭遇しなかったさまざまな干渉に対処し、タスクをスムーズに完了できます。

2. ケーブル配線:

多くの機械および電子機器の組み立てプロセス機器を設置するには、ケーブルを特定の経路に沿って正確に設置する必要があり、これは精度と適応性が非常に要求される作業です。フレキシブルケーブルは配線工程中に変形しやすく、ケーブルの誤動作やホルダーの位置の変化など、配線工程にさまざまな外乱が加わる可能性があるため、従来の非フレキシブルケーブルでは対応が困難でした。学習方法。 SERL は、わずか 30 分で 100% の成功率を達成できます。グリッパーの位置がトレーニング中のものと異なる場合でも、ロボットは学習したスキルを一般化し、新たな配線の課題に適応して、配線作業を正しく実行することができます。

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

#特別なトレーニングでは、クリップにケーブルを直接通すこともできます。トレーニング時とは違うポジション。

3. オブジェクトの取得と配置の操作:

倉庫管理または小売業業界では、ロボットは物品をある場所から別の場所に移動する必要があることが多く、そのためにはロボットが特定の物品を識別して運ぶことができる必要があります。強化学習のトレーニング プロセス中に、作動が不十分なオブジェクトを自動的にリセットすることは困難です。 SERL のリセット不要の強化学習機能を活用して、ロボットは 1 時間 45 分で 100/100 の成功率で 2 つのポリシーを同時に学習しました。順方向戦略を使用してオブジェクトをボックス A からボックス B に置き、次に逆方向戦略を使用してオブジェクトをボックス B からボックス A に戻します。

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です

20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速です#

図 9、10、11: SERL は、オブジェクトを右から左に運ぶ戦略と、オブジェクトを左から右に戻す戦略の 2 セットをトレーニングしました。このロボットは、オブジェクトのトレーニングで 100% の成功率を達成するだけでなく、これまで見たことのないオブジェクトをインテリジェントに処理することもできます。

##主な著者
1. Jianlan Luo

Jianlan Luo は現在、カリフォルニア大学バークレー校の電気・コンピューターサイエンス学部の博士研究員で、バークレー人工知能センター (BAIR) のセルゲイ・レヴィン教授と共同研究しています。彼の主な研究対象は、機械学習、ロボット工学、最適制御です。学界に戻る前は、Google X でフルタイムの研究者として、Stefan Schaal 教授と一緒に働いていました。それ以前は、カリフォルニア大学バークレー校でコンピューター サイエンスの修士号と機械工学の博士号を取得しており、この間、アリス アゴギノ教授およびピーター アッビール教授と協力しました。彼はディープマインドのロンドン本社で客員研究員も務めました。

2. Zheyuan Hu

彼はカリフォルニア大学バークレー校を卒業しました。コンピューターサイエンスと応用数学専攻の学士号。現在、セルゲイ・レヴィン教授率いるRAIL研究室で研究を行っている。彼はロボット学習の分野に強い関心を持っており、ロボットが現実世界で器用な操作スキルを迅速かつ広範囲に習得できるようにする方法の開発に焦点を当てています。

3. Charles Xu

彼はカリフォルニア大学の電気技師です。 , バークレー エンジニアリングとコンピューターサイエンスを専攻する学部4年生。現在、セルゲイ・レヴィン教授率いるRAIL研究室で研究を行っている。彼の研究対象はロボット工学と機械学習の交差点にあり、堅牢性が高く一般化可能な自律制御システムを構築することを目指しています。

4. You Liang Tan

彼はバークレー RAIL 研究所の研究エンジニアです、セルゲイ・レヴィン教授が監修。彼は以前、シンガポールの南洋工科大学で学士号を取得し、米国のジョージア工科大学で修士号を取得しました。それ以前は、Open Robotics Foundation のメンバーでした。彼の研究は、機械学習とロボット ソフトウェア テクノロジーの実世界への応用に焦点を当てています。

5. Stefan Schaal

##彼は 1991 年にミュンヘン工科大学で生まれました。機械工学と人工知能の博士号。彼は、MIT の脳・認知科学部門と人工知能研究所の博士研究員、日本の ATR 人間情報処理研究所の招聘研究員、ジョージア工科大学運動学部の非常勤助教を務めています。米国のペンシルバニア州立大学。また、日本のERATOプロジェクトであるジャワ・キネティック・ブレイン・プロジェクト(ERATO/JST)において計算学習グループのリーダーも務めました。 1997 年に、USC のコンピューター サイエンス、神経科学、生体医工学の教授となり、終身教授に昇進しました。彼の研究対象には、統計と機械学習、ニューラル ネットワークと人工知能、計算神経科学、脳機能イメージング、非線形力学、非線形制御理論、ロボット工学、生体模倣ロボットなどのトピックが含まれます。

彼は、ドイツのマックス プランク インテリジェント システム研究所の創設ディレクターの 1 人であり、そこで長年にわたって自律運動部門を率いていました。彼は現在、Alphabet (Google) の新しいロボット工学子会社である Intrinsic の主席研究員を務めています。 Stefan Schaal は IEEE フェローです。

6. チェルシー フィン

彼女は、コンピュータ サイエンスと電気工学を専攻しています。スタンフォード大学助教授。彼女の研究室 IRIS は、大規模なロボット インタラクションを通じて知能を研究しており、SAIL および ML グループの一部です。彼女は Google Brain チームのメンバーでもあります。彼女は、学習と対話を通じて幅広い知的行動を開発するロボットやその他の知的エージェントの能力に興味を持っています。彼女は以前、カリフォルニア大学バークレー校でコンピューター サイエンスの博士号を取得し、マサチューセッツ工科大学で電気工学とコンピューター サイエンスの学士号を取得しました。

7. アビシェク・グプタ

彼は、University of UniversityのPaul G. Allenです。ワシントンコンピュータサイエンスアンドエンジニアリングスクールの助教授、WEIRD研究所を率いる。以前は、MIT で博士研究員として、ラス テドレイクおよびプルキット アガルワルと協力していました。彼は、カリフォルニア大学バークレー校の BAIR で、Sergey Levine 教授と Pieter Abbeel 教授の指導の下、機械学習とロボット工学の博士号を取得しました。その前に、カリフォルニア大学バークレー校で学士号も取得しました。彼の主な研究目標は、ロボット システムがオフィスや家庭などのさまざまな非構造化環境で複雑なタスクの実行を学習できるようにするアルゴリズムを開発することです。

8. Sergey Levine

彼は、電気工学およびコンピュータ サイエンスの教授です。カリフォルニア大学バークレー校理学部准教授。彼の研究は、自律エージェントが複雑な動作を学習できるようにするアルゴリズム、特に自律システムがあらゆるタスクの解決方法を学習できるようにする一般的な方法に焦点を当てています。これらの方法の用途には、ロボット工学だけでなく、自律的な意思決定が必要な他のさまざまな分野が含まれます。

以上が20 分で回路基板の組み立てを学びましょう!オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍高速ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました Aug 09, 2024 pm 04:01 PM

でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した 初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した Aug 21, 2024 pm 07:33 PM

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう Sep 02, 2024 pm 01:56 PM

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました 世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました Aug 22, 2024 pm 10:35 PM

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件(未発表2件)、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Sep 03, 2024 pm 05:18 PM

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました 宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました Aug 08, 2024 am 07:02 AM

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

AI の使用 | Microsoft CEO のクレイジーなアムウェイ AI ゲームは私を何千回も苦しめた AI の使用 | Microsoft CEO のクレイジーなアムウェイ AI ゲームは私を何千回も苦しめた Aug 14, 2024 am 12:00 AM

Machine Power Report 編集者: Yang Wen 大型モデルや AIGC に代表される人工知能の波は、私たちの生活や働き方を静かに変えていますが、ほとんどの人はまだその使い方を知りません。そこで、直感的で興味深く簡潔な人工知能のユースケースを通じてAIの活用方法を詳しく紹介し、皆様の思考を刺激するコラム「AI in Use」を立ち上げました。また、読者が革新的な実践的な使用例を提出することも歓迎します。なんと、AIは本当に天才になってしまったのです。最近、AIが生成した写真の真贋を見分けるのが難しいと話題になっています。 (詳しくはこちら:AI活用中 | 3ステップでAI美女になり、1秒でAIに元に戻される) インターネット上で人気のAI Google ladyのほかにも、さまざまなFLUXジェネレーターが登場しています。ソーシャルプラットフォーム上に出現した

See all articles