Googleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかった-AI-php.cn

分類パフォーマンス

結論と今後の展望

ホームページ

テクノロジー周辺機器

Googleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかった

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 09, 2023 pm 03:01 PM

ai ごみの分別

強化学習 (RL) を使用すると、ロボットが試行錯誤を通じて対話し、複雑な動作を学習し、時間の経過とともにより優れたものになることができます。 Google のこれまでの研究では、RL によってロボットが物をつかむ、マルチタスクの学習、さらには卓球をするなどの複雑なスキルを習得できるようにする方法が検討されてきました。ロボットの強化学習は大きく進歩しましたが、強化学習を備えたロボットを日常の環境で目にすることはまだありません。現実の世界は複雑かつ多様で、時間の経過とともに常に変化しているため、ロボットシステムにとって大きな課題となります。しかし、強化学習はこれらの課題に対処するための優れたツールであるはずです。実際に仕事で練習、改善、学習することで、ロボットは絶えず変化する世界に適応できるはずです。

Google の論文「Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators」では、研究者が最新の大規模実験を通じてこの問題を解決する方法を模索しています。彼らは 2 年間にわたって 23 台の RL 対応ロボットを導入し、Google のオフィスビルでゴミの分別とリサイクルを行いました。使用されるロボットシステムは、実世界のデータからのスケーラブルな深層強化学習と、シミュレーショントレーニングからのガイド付きおよび補助的なオブジェクト認識入力を組み合わせて、エンドツーエンドのトレーニングの利点を維持しながら一般化を向上させます。

Googleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかった

論文アドレス: https://rl-at-scale.github.io/assets/rl_at_scale .pdf

##問題設定

#人々が廃棄物を適切に分別しないと、リサイクル可能なバッチが汚染され、堆肥が不適切に埋め立て地に廃棄される可能性があります。 Googleの実験では、ロボットがオフィスビルの周りを歩き回り、「ゴミ箱」（リサイクル箱、堆肥箱、その他のゴミ箱）を探した。ロボットのタスクは、各ゴミステーションに到着して廃棄物を分別し、すべてのリサイクル可能なアイテム (缶、ボトル) をリサイクル可能なビンに、すべての堆肥化可能なアイテム (段ボール容器、紙コップ) を堆肥ビンに入れるために、アイテムを異なるビン間で輸送することです。他のすべては他のビンにあります。

実際、この作業は思ったほど簡単ではありません。人々がゴミ箱に捨てたさまざまなアイテムを拾うというサブタスクだけでも、すでに大きな課題です。また、ロボットは各オブジェクトに適切なビンを識別し、できるだけ迅速かつ効率的にそれらを分類する必要があります。現実の世界では、ロボットは次のような実際のオフィスビルの例など、さまざまなユニークな状況に遭遇します。

さまざまな経験から学ぶ

職場での継続的な学習が役立ちます。 , しかし、その点に到達する前に、基本的なスキルのセットでロボットをガイドする必要があります。この目的を達成するために、Google は 4 つの経験のソースを使用します: (1) 成功率は低いが、初期の経験を提供するのに役立つ単純な手作業で設計された戦略、(2) シミュレーションから現実への移行を使用して、ある程度の経験を提供するシミュレーショントレーニングフレームワーク(3) ロボットが代表的なゴミステーションを使用して継続的に練習する「ロボット教室」、(4) 実際の導入環境、実際のゴミのあるオフィスビルでロボットが練習する。

Googleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかった

# この大規模アプリケーションにおける強化学習の概略図。スクリプトで生成されたデータを使用して、ポリシーの起動をガイドします (左上)。次に、シミュレーションから実際のモデルへのトレーニングが行われ、シミュレーション環境で追加のデータが生成されます (右上)。各導入サイクル中に、「ロボット教室」 (右下) で収集されたデータを追加します。オフィスビルでのデータの展開と収集 (左下)。

ここで使用される強化学習フレームワークは QT-Opt に基づいており、実験室環境やその他の一連のスキルでさまざまなゴミを捕捉するためにも使用されます。シミュレーション環境をガイドする簡単なスクリプト戦略から始めて、強化学習を適用し、CycleGAN ベースの転送方法を使用して、RetinaGAN を使用してシミュレーション画像をより現実的に見せます。

ここからが「ロボット教室」の始まりです。実際のオフィスビルは最もリアルな体験を提供しますが、データ収集のスループットには限界があります。分別すべきゴミが大量にある日もあれば、それほど多くない日もあります。ロボットはその経験のほとんどを「ロボット教室」で蓄積してきました。以下に示す「ロボット教室」では、20 台のロボットがゴミの分別作業を練習しています。

Googleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかった

#これらのロボットが「ロボット教室」で訓練されるとき同時に、他のロボットも 3 つのオフィスビルにある 30 個のゴミ箱で同時に学習していました。

分類パフォーマンス

研究者らは最終的に、「ロボット教室」から 540,000 件の実験データと、実際の展開環境での 325,000 件の実験データを収集しました。データが増加し続けると、システム全体のパフォーマンスが向上します。研究者らは、制御された比較を可能にするために「ロボット教室」で最終システムを評価し、実際の展開でロボットが目にするものに基づいてシナリオを設定しました。最終的なシステムは平均約 84% の精度を達成し、データが追加されるにつれてパフォーマンスは着実に向上しました。現実世界では、研究者らは 2021 年から 2022 年にかけて実際に導入された統計を文書化し、このシステムがゴミ箱内の汚染物質を重量で 40 ～ 50 パーセント削減できることを発見しました。 Google の研究者は論文の中で、テクノロジーの設計、さまざまな設計上の決定の減衰に関する研究、および実験からのより詳細な統計についてのより深い洞察を提供しています。

結論と今後の展望

実験結果は、強化学習ベースのシステムにより、ロボットが実際のオフィス環境で実際のタスクを処理できることを示しています。オフラインデータとオンラインデータを組み合わせることで、ロボットは現実世界のさまざまな状況に適応できるようになります。同時に、シミュレーション環境や実際の環境を含む、より制御された「教室」環境での学習は、強化学習の「はずみ車」が回転し始める強力な開始メカニズムを提供し、それによって適応性を実現できます。

重要な結果は達成されましたが、やるべきことはまだたくさんあります。最終的な強化学習戦略が常に成功するとは限らず、パフォーマンスを向上させるにはより強力なモデルが必要です。これを次のように拡張します。より幅広いタスク。さらに、他のタスク、他のロボット、さらにはインターネットビデオなどの他の経験源が、シミュレーションや「教室」から得られるスタートアップの経験をさらに補足する可能性があります。これらは今後取り組むべき課題です。

以上がGoogleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7467

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Laravelの地理空間：インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件：MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか？データ移行または構造調整は必要ですか？ MySQLはこのような大きなデータ負荷に耐えることができますか？予備分析：キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合（ポート占有率をチェックして構成の変更）、許可の問題（ユーザー許可を実行するサービスを確認）、構成ファイルエラー（パラメーター設定のチェック）、データディレクトリの破損（テーブルスペースの復元）、INNODBテーブルスペースの問題（IBDATA1ファイルのチェック）、プラグインロード障害（エラーログのチェック）が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

リモートシニアバックエンジニア（プラットフォーム）がサークルが必要です Apr 08, 2025 pm 12:27 PM

リモートシニアバックエンジニアの求人事業者：サークル場所：リモートオフィスジョブタイプ：フルタイム給与：$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

mysqlはjsonを返すことができますか Apr 08, 2025 pm 03:09 PM

MySQLはJSONデータを返すことができます。 json_extract関数はフィールド値を抽出します。複雑なクエリについては、Where句を使用してJSONデータをフィルタリングすることを検討できますが、そのパフォーマンスへの影響に注意してください。 JSONに対するMySQLのサポートは絶えず増加しており、最新バージョンと機能に注意を払うことをお勧めします。

酸性特性を理解する：信頼できるデータベースの柱 Apr 08, 2025 pm 06:33 PM

データベース酸属性の詳細な説明酸属性は、データベーストランザクションの信頼性と一貫性を確保するための一連のルールです。データベースシステムがトランザクションを処理する方法を定義し、システムのクラッシュ、停電、または複数のユーザーの同時アクセスの場合でも、データの整合性と精度を確保します。酸属性の概要原子性：トランザクションは不可分な単位と見なされます。どの部分も失敗し、トランザクション全体がロールバックされ、データベースは変更を保持しません。たとえば、銀行の譲渡が1つのアカウントから控除されているが別のアカウントに増加しない場合、操作全体が取り消されます。 TRANSACTION; updateaccountssetbalance = balance-100wh

MySQLの主な鍵はヌルにすることができます Apr 08, 2025 pm 03:03 PM

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

マスターSQL制限条項：クエリの行数を制御する Apr 08, 2025 pm 07:00 PM

sqllimit句：クエリ結果の行数を制御します。 SQLの制限条項は、クエリによって返される行数を制限するために使用されます。これは、大規模なデータセット、パジネートされたディスプレイ、テストデータを処理する場合に非常に便利であり、クエリ効率を効果的に改善することができます。構文の基本的な構文：SelectColumn1、column2、... FromTable_nameLimitnumber_of_rows; number_of_rows：返された行の数を指定します。オフセットの構文：SelectColumn1、column2、... FromTable_nameLimitoffset、number_of_rows; offset：skip

See all articles

Googleはゴミの分別を支援する強化学習を使用して23台のロボットを構築するのに2年かかった

分類パフォーマンス

結論と今後の展望

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック