深層学習の巨人 DeepMind は ImageNet データセットで画期的な進歩を遂げ、ロボット研究に新たなマイルストーンをもたらしました
なぜロボット工学は、自然言語処理 (NLP)、視覚、その他の人工知能分野に大きく遅れをとっているのでしょうか?さまざまな問題の中でも特に、データ不足が主な理由です。この問題を解決するために、Google DeepMind とその他の機関はオープン X-Embodiment データセットを立ち上げ、より強力な RT-X モデルのトレーニングに成功しました

#これはどのようにして達成されるのでしょうか?
ロボットは通常、特定のことを行うことに非常に特化していますが、一般的な能力は貧弱であることがわかっています。通常、タスク、ロボット、環境ごとにモデルをトレーニングする必要があります。変数を変更するには、多くの場合、最初からやり直す必要があります。しかし、さまざまなロボット工学分野の知識を組み合わせて、万能ロボットを訓練する方法を作成できたらどうなるでしょうか?
これは、DeepMind がしばらくの間取り組んできたことです。彼らは、22 種類の異なるロボットからのデータをプールして Open X-Embodiment データセットを作成し、より高性能な RT-X (それぞれ RT-1-X と RT-2-X) をトレーニングしました。
彼らは 5 つの異なる研究機関で RT-1-X モデルをテストし、その結果、新しい方法がロボットごとに個別に開発された方法よりも優れたパフォーマンスを示したことがわかりました。一般的に使用される 5 種類のロボット間で成功率が 50% 増加しました。また、上記のデータセットでトレーニングされた RT-2-X が現実世界のロボット スキルのパフォーマンスを 2 倍向上させ、新しいデータを学習することで RT-2-X が多くの新しいスキルを習得することも示しています。この研究は、複数のロボット タイプのデータでトレーニングされた単一のモデルが、単一のロボット タイプのデータでトレーニングされたモデルよりも複数のロボット上で大幅に優れたパフォーマンスを発揮することを示しています。


具体的には、RT-1 を使用して RT-1-X をトレーニングしました。RT-1 は、Transformer アーキテクチャ上に構築された 35M パラメータ ネットワークであり、ロボット制御用に設計されています。設計を図 3 に示します。
RT-1-X の平均成功率は、元の方法より 50% 高くなります。

順番にRT-X の知識伝達機能を研究するために、DeepMind は他の実験を実施しました。これらの実験には、RT-2 データセットには存在しないが、別のロボットのデータセットには存在していたオブジェクトとスキルが含まれていました。その結果、RT-2-X は、以前の最高のモデルである RT-2 に比べて、新しいスキルの習得に 3 倍成功していることがわかりました。これは、他のプラットフォームからのデータを使用した共同トレーニングにより、元のデータセットには存在しない追加のスキルを RT-2-X に与え、新しいタスクを実行できることも示しています。

RT-2-X は、他のロボットからのデータを RT-2-X トレーニングに組み込むことでロボットのタスクのパフォーマンス範囲を向上できることを示していますが、これは十分に高いデータを使用した場合に限られます。容量アーキテクチャ。
##ロボット研究は、刺激的な初期段階にあります。 DeepMind によるこの新しい研究は、より多様なデータとより優れたモデルを使用して学習を拡張することで、より有用な支援ロボットを開発できる可能性があることを示しています。オープンかつ責任ある方法でロボット研究を進めるには、世界中の研究室と協力してリソースを共有することが重要です。 DeepMind は、データ ソースをオープンし、安全だが限定的なモデルを提供することで障壁を減らし、研究を加速したいと考えています。ロボット工学の未来は、ロボットが相互に学習すること、そして最も重要なこととして、研究者が相互に学習できるかどうかにかかっています。
論文リンク: https://robotics-transformer-x.github.io/paper.pdf

参考リンク: https://www.deepmind.com/blog/scaling -さまざまな種類のロボットを対象とした学習 #
以上が深層学習の巨人 DeepMind は ImageNet データセットで画期的な進歩を遂げ、ロボット研究に新たなマイルストーンをもたらしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件(未発表2件)、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

Machine Power Report 編集者: Yang Wen AI ビデオ サークルの王になれるのは誰ですか?アメリカのテレビシリーズ「ゲーム・オブ・スローンズ」に「鉄の玉座」というものがあります。伝説によれば、それは最高の権威を象徴する敵が捨てた数千の剣を溶かした巨大なドラゴン「黒死病」によって作られたとされています。この鉄の椅子に座るために、主要な家族は争いと争いを始めました。 Sora の登場以来、AI ビデオ界では活発な「ゲーム オブ スローンズ」が立ち上がっています。このゲームの主なプレーヤーには、国内の Kuaishou Keling、ByteDream だけでなく、海の向こうの RunwayGen-3 や Luma も含まれます。およびZhimo。今日は、誰が AI ビデオサークルの「鉄の玉座」に座る資格があるかを評価して確認します。 -1- ヴィンセントビデオ
