英語のコマンドを理解して家事を行えるロボットを研究者が開発
プリンストン大学、スタンフォード大学、Google の研究者チームは、OpenAI の GPT-3 Davinci モデルを使用して、英語の指示を理解し、家事を行うことができる TidyBot という名前のロボットを開発しました。このロボットは、洗濯物の仕分け、床のゴミ拾い、おもちゃの拾い上げなどの作業をユーザーの好みに応じて自動で完了します。
GPT-3 Davinci モデルは、GPT モデル ファミリーの一部である深層学習モデルであり、自然言語を理解して生成できます。このモデルには強力な要約機能があり、大量のテキスト データから複雑なオブジェクトの属性と関係を学習できます。研究者らはこの機能を利用して、「引き出しの中の黄色いシャツ、クローゼットの中の濃い紫色のシャツ、引き出しの中の白い靴下」など、ユーザーが提供したいくつかのオブジェクト例に基づいてロボットにオブジェクトを配置させ、モデルに結論を与えました。ユーザーの一般的な設定ルールを取得し、それを将来のインタラクションに適用します。
研究者らは論文の中で次のように書いています:「私たちの基本的な洞察は、LLM (大規模言語モデル) の要約機能は、パーソナライズされたロボットの一般化ニーズによく適合するということです。LLM は、要約を通じて一般化を達成する能力を示しています」膨大なテキスト データセットから学んだ複雑なオブジェクトのプロパティと関係を活用する驚くべき能力。」
彼らは次のようにも書いています。「高価なデータ収集とモデル トレーニングを必要とする従来の方法とは異なり、LLM が分野で一般化を達成できることを示しました。大量のテキスト データから学習した強力な要約機能を利用して、箱から出してすぐに使えるロボット工学を実現します。」
研究者らは、洗濯ができるロボットを同紙の Web サイトでデモンストレーションしました。明るい色と暗い色に分けてリサイクルします。飲み物の缶を捨てる、ゴミを捨てる、袋やカトラリーを詰める、散らばったものを元の位置に戻す、おもちゃを引き出しにしまう。
研究者らは最初にテキストベースのベンチマーク データセットをテストしました。このデータセットにはユーザーの好みが入力され、モデルはアイテムの帰属を決定するパーソナライゼーション ルールを作成するように求められました。モデルは例を一般的なルールに要約し、その要約を使用して新しい項目を配置する場所を決定します。ベースライン シーンは 4 つの部屋で定義され、それぞれに 24 のシーンがあります。各シーンにはアイテムを配置する 2 ~ 5 つの場所が含まれており、モデルが分類するために見えるアイテムと見えないアイテムの数は同じです。このテストでは、目に見えないアイテムに関して91.2パーセントの精度を達成したと彼らは書いている。
この方法を現実世界のロボット TidyBot に適用したところ、物体の 85% をうまく拾うことができたことがわかりました。 TidyBot は、それぞれ 10 個のオブジェクトのセットを含む 8 つの実際のシナリオでテストされ、ロボットは各シナリオで 3 回実行されました。 IT House によると、TidyBot は LLM に加えて、CLIP と呼ばれる画像分類器と OWL-ViT と呼ばれる物体検出器も使用しています。
ジョージア工科大学インタラクティブ コンピューティング学部の助教授であるダンフェイ シュー氏は、Google の PaLM-E モデルについて話した際、LLM によってロボットにさらなる問題解決能力が与えられると述べました。 「これまでのミッション計画システムのほとんどは、何らかの検索アルゴリズムや最適化アルゴリズムに依存していましたが、柔軟性が低く、構築が困難でした。LLM とマルチモーダル LLM により、これらのシステムはインターネット規模のデータから恩恵を受け、新しい問題の解決に簡単に使用できるようになります」と同氏は述べています。 。
以上が英語のコマンドを理解して家事を行えるロボットを研究者が開発の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

人型ロボット「アメカ」が第二世代にバージョンアップ!最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。 「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

今週、OpenAI、Microsoft、Bezos、Nvidiaが投資するロボット企業FigureAIは、7億ドル近くの資金調達を受け、来年中に自立歩行できる人型ロボットを開発する計画であると発表した。そしてテスラのオプティマスプライムには繰り返し良い知らせが届いている。今年が人型ロボットが爆発的に普及する年になることを疑う人はいないだろう。カナダに拠点を置くロボット企業 SanctuaryAI は、最近新しい人型ロボット Phoenix をリリースしました。当局者らは、多くのタスクを人間と同じ速度で自律的に完了できると主張している。人間のスピードでタスクを自律的に完了できる世界初のロボットである Pheonix は、各オブジェクトを優しくつかみ、動かし、左右にエレガントに配置することができます。自律的に物体を識別できる

今日の急速な技術変化の波の中で、人工知能 (AI)、機械学習 (ML)、および深層学習 (DL) は輝かしい星のようなもので、情報技術の新しい波をリードしています。これら 3 つの単語は、さまざまな最先端の議論や実践で頻繁に登場しますが、この分野に慣れていない多くの探検家にとって、その具体的な意味や内部のつながりはまだ謎に包まれているかもしれません。そこで、まずはこの写真を見てみましょう。ディープラーニング、機械学習、人工知能の間には密接な相関関係があり、進歩的な関係があることがわかります。ディープラーニングは機械学習の特定の分野であり、機械学習

産業オートメーション技術の分野では、人工知能 (AI) と Nvidia という無視できない 2 つの最近のホットスポットがあります。元のコンテンツの意味を変更したり、コンテンツを微調整したり、コンテンツを書き換えたり、続行しないでください。「それだけでなく、Nvidia はオリジナルのグラフィックス プロセッシング ユニット (GPU) に限定されていないため、この 2 つは密接に関連しています。」このテクノロジーはデジタル ツインの分野にまで広がり、新たな AI テクノロジーと密接に関係しています。「最近、NVIDIA は、Aveva、Rockwell Automation、Siemens などの大手産業オートメーション企業を含む多くの産業企業と提携に至りました。シュナイダーエレクトリック、Teradyne Robotics とその MiR および Universal Robots 企業も含まれます。最近、Nvidiahascoll

Machine Power Report 編集者: Wu Xin 国内版の人型ロボット + 大型模型チームは、衣服を折りたたむなどの複雑で柔軟な素材の操作タスクを初めて完了しました。 OpenAIのマルチモーダル大規模モデルを統合したFigure01の公開により、国内同業者の関連動向が注目を集めている。つい昨日、中国の「ヒューマノイドロボットのナンバーワン株」であるUBTECHは、Baidu Wenxinの大型モデルと深く統合されたヒューマノイドロボットWalkerSの最初のデモを公開し、いくつかの興味深い新機能を示した。 Baidu Wenxin の大規模モデル機能の恩恵を受けた WalkerS は次のようになります。 Figure01 と同様に、WalkerS は動き回るのではなく、机の後ろに立って一連のタスクを完了します。人間の命令に従って服をたたむことができる

2006 年にディープ ラーニングの概念が提案されてから、ほぼ 20 年が経過しました。ディープ ラーニングは、人工知能分野における革命として、多くの影響力のあるアルゴリズムを生み出してきました。では、ディープラーニングのトップ 10 アルゴリズムは何だと思いますか?私の考えでは、ディープ ラーニングのトップ アルゴリズムは次のとおりで、いずれもイノベーション、アプリケーションの価値、影響力の点で重要な位置を占めています。 1. ディープ ニューラル ネットワーク (DNN) の背景: ディープ ニューラル ネットワーク (DNN) は、多層パーセプトロンとも呼ばれ、最も一般的なディープ ラーニング アルゴリズムです。最初に発明されたときは、コンピューティング能力のボトルネックのため疑問視されていました。最近まで長年にわたる計算能力、データの爆発的な増加によって画期的な進歩がもたらされました。 DNN は、複数の隠れ層を含むニューラル ネットワーク モデルです。このモデルでは、各層が入力を次の層に渡し、

以下の 10 種類の人型ロボットが私たちの未来を形作ります。 1. ASIMO: ホンダが開発した ASIMO は、最もよく知られている人型ロボットの 1 つです。身長 4 フィート、体重 119 ポンドの ASIMO には、高度なセンサーと人工知能機能が装備されており、複雑な環境をナビゲートし、人間と対話することができます。 ASIMO は多用途性を備えているため、障害を持つ人々の支援からイベントでのプレゼンテーションまで、さまざまなタスクに適しています。 2. Pepper: ソフトバンクロボティクスによって作成された Pepper は、人間の社会的パートナーになることを目指しています。表情豊かな顔と感情を認識する能力を備えた Pepper は、会話に参加したり、小売現場で手助けしたり、教育サポートを提供したりすることもできます。コショウ
