ロボット実装の「秘密」: 継続的な学習、知識の伝達、自律的な参加
この記事は Lei Feng.com から転載されたものです。転載する必要がある場合は、Lei Feng.com の公式 Web サイトにアクセスして許可を申請してください。
2022年5月23日、ロボット工学分野の年次トップ国際会議であるICRA 2022 (IEEE International Conference on Robotics and Automation)が米国フィラデルフィアで予定通り開催されました。
ICRA は今年で 39 年目になります。 ICRA は、IEEE ロボット工学およびオートメーション協会の主力会議であり、ロボット研究者が研究成果を発表し議論するための主要な国際フォーラムです。
今年の ICRA では、Amazon のロボット工学の主任専門家である Sidd Srinivasa、Tye Brady、Philipp Michel の 3 人が、現実世界での人間と機械の相互作用のためのロボット システムを構築する際の課題について簡単に議論しました。
注: 左から右へ、Amazon Robotics の人工知能担当ディレクターである Sidd Srinivasa 氏、Amazon Robotics (グローバル) のチーフテクニカルエキスパート、およびシニアマネージャーの Tye Brady 氏です。 Amazon の応用科学スカウト Philipp MichelSidd
Srinivasa は世界的に有名なロボット工学の専門家であり、IEEE フェローであり、現在はワシントン大学ボーイング社の特別教授であり、Amazon ロボット人工知能プロジェクトのリーダーです。アマゾン物流センターの従業員を支援する自律型ロボットのアルゴリズム管理を担当し、商品の梱包・梱包を行うロボットや、自律的に商品の持ち上げ・降ろし・搬送を行うカート型ロボットの研究を行っています。
Tye Brady は、Amazon Robotics (グローバル) の主任技術専門家であり、MIT で航空宇宙工学の修士号を取得しています。 Philipp Michel と Sidd Srinivasa はどちらも CMU Robotics Institute の博士課程の卒業生であり、Amazon の Scout ロボット プロジェクトの上級マネージャーです。
彼らは、ロボット着陸の課題の解決について独自の見解を発表しました。 AI テクノロジーのレビューは、その本来の意味を変えることなく次のようにまとめられています:
Q: ロボット工学の分野におけるあなたの研究は、さまざまな問題を解決していますが、これらの問題の類似点は何ですか?
シッド スリニヴァーサ: ロボット研究における重要な困難は、私たちがオープンワールドに住んでいることです。 「入力」が何に直面しようとしているのかさえわかりません。当社のフルフィルメント センターでは 2,000 万点を超える商品を管理しており、その数は毎日数百点ずつ増加しています。ほとんどの場合、私たちのロボットは拾う品物が何であるかを知りませんが、慎重に品物を拾い上げ、損傷することなく迅速に梱包する必要があります。
フィリップ・ミシェル: スカウトにとって、困難なのは歩道で遭遇する物体と交通環境です。当社は全米 4 つの州に民間の配送施設を展開しています。気象条件、照明条件...ロボットが複雑な環境に適応できるようにするには、多数の変数に対処する必要があることは最初から明らかでした。
Tye Brady: 実行ロボットの開発プロセスにおいて、私たちは半構造化された環境で動作するという大きな利点を持っています。私たちはロボットのための独自の交通ルールを作ることができ、環境を理解することは、科学者やエンジニアが注文を満たすために移動、操作、分類、識別したい物体を深く理解するのに非常に役立ちます。つまり、現実世界でのテクノロジーの追求を実現できるのです。
フィリップ・ミシェル: 私たちにもう 1 つ共通しているのは、問題を解決するためにデータからの学習に大きく依存していることです。 Scout はタスクを実行する際に現実世界のデータを受け取り、知覚、位置特定、ナビゲーションのための機械学習ソリューションを反復的に開発します。
Sidd Srinivasa: 私も完全に同意します(データから問題を解決する方法を学ぶ)。機械学習と適応制御が超線形スケーリングの鍵だと思います。数千台のロボットを導入する場合、何千人もの科学者やエンジニアがロボットに取り組むことはできず、超直線的な成長を達成するには実世界のデータに依存する必要があります。
また、オープンワールドでは「学び続ける」ということをどうやって考えていくかということも考えざるを得ないと思います。私たちの機械学習モデルは多くの場合、いくつかの入力データの分布に基づいてトレーニングされますが、これはオープンワールドであるため、「共変量シフト」、つまり、表示されるデータが分布と一致しないという問題に遭遇することになります。学習モデルは理由もなく自信過剰になることがよくあります。
したがって、私たちが行う作業の多くは、入力データの分布がトレーニングに使用された分布から逸脱する時期を特定するために「ウォッチドッグ」(ウォッチドッグ、監視デバイス) を作成することです。次に、変更されたデータを抽出して機械学習モデルを再トレーニングできるように、「重要度サンプリング」を実行します。
Philipp Michel: これが、ロボットが遭遇する可能性のある実際のデータを早い段階で知ることができるように、さまざまな場所でロボットをトレーニングしたい理由の 1 つです。そのため、新しいデータに対応するソリューションを開発する必要があります。
シッド・スリニヴァーサ: これは確かに良いアイデアです。複数のロボットを使用する利点の 1 つは、システムが変更されたコンテンツを認識し、再トレーニングし、この知識を他のロボットと共有できることです。
仕分けロボットに関するストーリーを考えてみましょう: 世界の片隅で、ロボットが新しいタイプの包装に遭遇します。最初はこんなもの見たことがなく認識できずに困っていました。そこで、新しいソリューションが登場しました。それは、新しい包装タイプを世界中のすべてのロボットに送信できるロボットです。そうすれば、この新しい包装タイプが他の場所に現れたとき、他のロボットはそれをどう扱うべきかを知ることができます。これは、「バックアップ」を持つことと同じであり、ある時点で新しいデータが出現すると、システムが再学習して情報を共有できるため、他のポイントもそれを知ることができます。
フィリップ・ミシェル: 私たちのロボットも同様のことをしています。ロボットがこれまでに遭遇したことのない新しい障害物に遭遇した場合、それらの障害物を認識して対処するようにモデルを調整し、新しいモデルをすべてのロボットに展開しようとします。
私が夜も眠れなくなることの 1 つは、ロボットが歩道で次のような新しい物体に遭遇し、今後 3 年間は二度と遭遇しないだろうという考えです。 歩道にいる人々 ガーゴイルハロウィーンの芝生を飾るために使用されたり、「ピクニックテーブル」のように見えないようにするためにピクニックテーブルに傘を置いたりします。この場合、すべての機械学習アルゴリズムは、これがピクニック テーブルであることを認識できません。
つまり、私たちの研究の一部は、特定のカテゴリの物事と絡める必要のない一般的な物事のバランスをとる方法に関するものです。これが開いたマンホールの蓋の場合、ロボットはそれを識別するのが上手でなければなりません。そうしないと、蓋が落ちてしまいます。しかし、それが単なるランダムなボックスの場合は、おそらくボックスの階層を知る必要はなく、これが歩き回りたいオブジェクトであることだけを知る必要があります。
Sidd Srinivasa: もう 1 つの課題は、モデルを変更すると、意図しない結果が生じる可能性があることです。変更されたモデルはロボットの知覚には影響しないかもしれませんが、ロボットの「ブレーキ」の方法が変更され、2 か月後にボール ベアリングが摩耗する可能性があります。エンドツーエンド システムでは、将来の興味深い研究の多くは、「システムの一部の変更がシステム全体のパフォーマンスに及ぼす影響を理解する」ことに関するものです。
Philipp Michel: 私たちは、ロボット スタックのさまざまな部分を分割する必要があるかどうかについて、多くの時間を費やして検討しました。両者を統合すると多くのメリットがもたらされますが、限界もあります。極端な例としては、カメラからモーター、トルクへの学習が挙げられますが、これは現実世界のロボット工学アプリケーションでは非常に困難です。次に、従来のロボット スタックがあります。これは、位置特定、認識、計画、制御などの部分にうまく分割されています。
私たちはまた、スタックが時間の経過とともにどのように進化すべきか、そしてこれらの部分を近づけるとどのようなパフォーマンスの向上があるのかについて考えることに多くの時間を費やしました。同時に、できる限り解釈可能なシステムを構築したいと考えています。私たちは、解釈可能性と安全機能の数を維持しながら、スタック全体を活用して学習コンポーネントの統合を最大限に高めることを試みます。
シッド スリニヴァーサ: これは素晴らしい点です。私はフィリップの見解に完全に同意します。1 つのモデルを使用してすべてのモデルを支配するのは正しくないかもしれません。しかし、多くの場合、複数の適用ヘッドとバックボーンを共有する機械学習モデルを構築することになります。オブジェクトとは何ですか?また、オブジェクトをセグメント化するとはどういう意味ですか?それはピッキング、積み上げ、梱包のようなものかもしれませんが、それぞれの作業に特化したバックボーンに乗っている専門的な頭が必要です。
Philipp Michel: 私たちが考慮する要素には、バッテリー、航続距離、温度、スペース、コンピューティングの制約などがあります。したがって、モデルを効率的に使用し、モデルを最適化し、シッドが述べたように、異なるタスクに異なるヘッドを配置するなど、共有されたバックボーンを可能な限り活用する必要があります。
キャプション: Amazon Scout は、公共の歩道を歩く速度で移動できる自律型配送ロボットで、現在米国の 4 つの州でフィールドテストが行われています。
Q: あなたのプロジェクトの共通点について尋ねたとき、あなたのロボットがすべて人間と同じ環境で動作するということが頭に浮かびました。なぜこれが問題を複雑にするのでしょうか?
シッド スリニヴァーサ: ロボットは人間の生活に近づいており、私たちは人間の世界で起こるすべての複雑な相互作用を尊重する必要があります。歩いたり、運転したり、タスクを実行したりすることに加えて、複雑な社会的相互作用もあります。ロボットにとって重要なことは、第一に意識を持つこと、第二に関与することです。
運転中、他の人が何を考えているかを理解し、彼らの考えに基づいてどのように行動するかを決めるのが難しい場合があります。問題について推論するだけでも困難ですが、ループを閉じるのはさらに困難です。
ロボットがチェスをしたり、人間と対戦したりする場合、ルールがすでに明確に定められているため、ロボットが何をするかを予測するのははるかに簡単です。対戦相手が最適であると仮定すれば、たとえ相手が最適ではなかったとしても、自分はうまくいくでしょう。一部の 2 人用ゲームではこれが保証されています。
しかし、実際の状況はそうではなく、このようにwin-winの状況を保証する協力ゲームをプレイすると、協力者がたとえ協力者に能力を持っていたとしても、ゲーム中に正確に予測することは実際には困難であることがわかります。善意。
フィリップ・ミシェル: そして、人間世界の行動は大きく変わります。ペットによってはロボットを完全に無視したり、ロボットに向かって歩いてきたりするペットもいます。歩行者も同様で、ロボットを見て見ぬふりをする人もいれば、ロボットのすぐ近くまで歩いてくる人もいる。特に子供たちは非常に好奇心旺盛で、非常にインタラクティブであるため、私たちはあらゆる状況に安全に対処できる必要があり、こうした変化は興味深いものです。
以上がロボット実装の「秘密」: 継続的な学習、知識の伝達、自律的な参加の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









最新のニュースによると、Amazon はハイエンド電子書籍リーダー Kindle Oasis の販売終了を発表し、米国市場から削除しました。この動きは、かつて大いに期待されていた Kindle Oasis が正式に市場から撤退したことを示しています。カナダやイギリスなど一部の海外市場ではまだ少量の在庫がございますが、売り切れ次第終了となります。これは、この高く評価された高級リーダーが過去のものになる始まりを示しています。 Kindle Oasis は優れたパフォーマンスとデザインでユーザーに愛されていますが、市場の需要の変化や新製品の発売に伴い、Amazon がこの製品の販売終了を決定する可能性があります。 Kindle Oasis は市場に一定の足跡を残したが、Amazon は他の製品ラインに焦点を移した可能性がある

人型ロボット「アメカ」が第二世代にバージョンアップ!最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。 「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

産業オートメーション技術の分野では、人工知能 (AI) と Nvidia という無視できない 2 つの最近のホットスポットがあります。元のコンテンツの意味を変更したり、コンテンツを微調整したり、コンテンツを書き換えたり、続行しないでください。「それだけでなく、Nvidia はオリジナルのグラフィックス プロセッシング ユニット (GPU) に限定されていないため、この 2 つは密接に関連しています。」このテクノロジーはデジタル ツインの分野にまで広がり、新たな AI テクノロジーと密接に関係しています。「最近、NVIDIA は、Aveva、Rockwell Automation、Siemens などの大手産業オートメーション企業を含む多くの産業企業と提携に至りました。シュナイダーエレクトリック、Teradyne Robotics とその MiR および Universal Robots 企業も含まれます。最近、Nvidiahascoll

Machine Power Report 編集者: Wu Xin 国内版の人型ロボット + 大型模型チームは、衣服を折りたたむなどの複雑で柔軟な素材の操作タスクを初めて完了しました。 OpenAIのマルチモーダル大規模モデルを統合したFigure01の公開により、国内同業者の関連動向が注目を集めている。つい昨日、中国の「ヒューマノイドロボットのナンバーワン株」であるUBTECHは、Baidu Wenxinの大型モデルと深く統合されたヒューマノイドロボットWalkerSの最初のデモを公開し、いくつかの興味深い新機能を示した。 Baidu Wenxin の大規模モデル機能の恩恵を受けた WalkerS は次のようになります。 Figure01 と同様に、WalkerS は動き回るのではなく、机の後ろに立って一連のタスクを完了します。人間の命令に従って服をたたむことができる

今週、OpenAI、Microsoft、Bezos、Nvidiaが投資するロボット企業FigureAIは、7億ドル近くの資金調達を受け、来年中に自立歩行できる人型ロボットを開発する計画であると発表した。そしてテスラのオプティマスプライムには繰り返し良い知らせが届いている。今年が人型ロボットが爆発的に普及する年になることを疑う人はいないだろう。カナダに拠点を置くロボット企業 SanctuaryAI は、最近新しい人型ロボット Phoenix をリリースしました。当局者らは、多くのタスクを人間と同じ速度で自律的に完了できると主張している。人間のスピードでタスクを自律的に完了できる世界初のロボットである Pheonix は、各オブジェクトを優しくつかみ、動かし、左右にエレガントに配置することができます。自律的に物体を識別できる

本サイトの7月31日のニュースによると、テクノロジー大手アマゾンは火曜日、クラウドコンピューティング技術に関連するアマゾンの十数件の特許を侵害しているとして、フィンランドの通信会社ノキアをデラウェア州連邦裁判所に告訴した。 1. Amazon は訴訟の中で、Nokia が自社のクラウド サービス製品を強化するために、クラウド コンピューティング インフラストラクチャ、セキュリティおよびパフォーマンス テクノロジを含む Amazon クラウド コンピューティング サービス (AWS) 関連テクノロジを悪用したと述べました。訴状によると、アマゾンは2006年にAWSを立ち上げ、その画期的なクラウドコンピューティング技術は2000年代初頭から開発されていたという。訴状には「アマゾンはクラウドコンピューティングのパイオニアだが、現在ノキアはアマゾンの特許取得済みのクラウドコンピューティング技術革新を許可なく使用している」と書かれている。アマゾン、ブロック差し止めを裁判所に求める

以下の 10 種類の人型ロボットが私たちの未来を形作ります。 1. ASIMO: ホンダが開発した ASIMO は、最もよく知られている人型ロボットの 1 つです。身長 4 フィート、体重 119 ポンドの ASIMO には、高度なセンサーと人工知能機能が装備されており、複雑な環境をナビゲートし、人間と対話することができます。 ASIMO は多用途性を備えているため、障害を持つ人々の支援からイベントでのプレゼンテーションまで、さまざまなタスクに適しています。 2. Pepper: ソフトバンクロボティクスによって作成された Pepper は、人間の社会的パートナーになることを目指しています。表情豊かな顔と感情を認識する能力を備えた Pepper は、会話に参加したり、小売現場で手助けしたり、教育サポートを提供したりすることもできます。コショウ
