テスラのオプティマス人型ロボットは工場で働き、バッテリーの分解や自己修正に熟練しており、さらに先のことも可能です
テスラの人型ロボットが新しいスキルを解放しました!
昨日、テスラ オプティマスは、第 2 世代オプティマス ヒューマノイド ロボットの最新の進歩を示す新しいデモ ビデオを正式にリリースしました。
#今回、オプティマスは工場で働き始め、テスラ電池工場で電池の組み立て方を学び、以前よりも速く歩き、さらに遠くまで歩きました。より安定した。
まずは、オプティマスの最新スキルとトレーニングの詳細を見てみましょう。
Optimus のエンドツーエンドのニューラル ネットワークは、テスラの工場でバッテリー セルを正確にパッケージングできるようにトレーニングされています。
2D カメラ、手のタッチ、力だけに頼って、ロボットの FSD コンピューター上でリアルタイムに実行します。センサー。オプティマスは脚を使ってバランスを保ち、ネットワークが上半身全体を動かします。
挿入プロセスには非常に正確な動きが必要であり、ニューラル ネットワークは次の空きスロットを自動的に見つけます。 Optimus は障害から自律的に回復することもできます。
Optimus のトレーニング データは人間の遠隔操作によって収集され、さまざまなタスクに合わせて拡張されます。
Optimus は工場でテストされており、人間の介入率は減少し続けています。
もちろん、オプティマスは定期的にオフィス内を歩き回れるようになり、より速くなっただけでなく、より遠くまで歩くことができるようになりました。
これに関して、Tesla Optimus (Tesla Bot) エンジニアの Milan Kovac 氏が、Optimus のトレーニングについて詳しく説明しました。
過去数か月にわたって、テスラの素晴らしい製造チームは、研究を実施し、労働スマート データを収集するために、さらに多くのロボットを構築してきました。
チームはニューラル ネットワークをトレーニングして展開し、コンベア ベルトからバッテリー セルを拾い上げてパレットに正確に挿入するなど、Optimus が有用なタスクを実行できるようにしました。
このニューラル ネットワークは完全にエンドツーエンドで動作します。つまり、Optimus はロボットの 2D カメラからのビデオとオンボードの固有受容体からのデータのみを消費し、関節制御シーケンスを直接生成します。
Optimus は、ロボットに組み込まれた FSD コンピューター上で完全に実行され、オンボード バッテリーによって電力が供給されます。この設計により、より多様なデータをトレーニング プロセスに追加することで、単一のニューラル ネットワークで複数のタスクを実行できるようになります。
Optimus はまだ完璧ではなく、まだ少し遅いですが、成功率はますます高くなり、間違いはますます減少しています。テスラはまた、故障事例から回復するようにオプティマスを訓練し、自発的な修正が起こることを確認しました。
テスラは、工場に複数の Optimus 人型ロボットを導入し、実際のワークステーションで毎日テストされ、継続的に改善されています。
チームは、オプティマスの人間性を犠牲にすることなく、より速く移動し、より荒れた地形を処理できるようにするためのさらなる作業を行っています。チームは再現性にも重点を置き、動的キャリブレーションやロボット間の小さな違いを処理できるようにニューラルネットワークをトレーニングする予定だ。近々さらにアップデートが行われる予定です。
さらに、Nvidia の上級研究科学者で AI エージェントの責任者である Jim Fan は、Optimus の新しいビデオで実証されたスキルを高く評価しました。
# 彼は、このビデオによって人間のデータ収集の実際の状況を垣間見ることができ、それがオプティマスの最大の利点であると信じています。このようなパイプラインを構築するには何が必要でしょうか? Optimus は次のことを行います:
Optimus のハンドは、多くの競合製品と比較して、触覚認識と 11 の自由度 (DOF) を備えた世界トップレベルの 5 本指のロボット ハンドです。自由度はわずか 6 ~ 7 で、非常に堅牢であり、継続的なメンテナンスを必要とせずに多数のオブジェクトの相互作用に耐えることができます。
遠隔操作ソフトウェア: VR メガネと手袋を着用している人間のオペレーターが見えます。非常に低い遅延を維持しながら、一人称ビデオのリアルタイム ストリーミングと出力の正確な制御を可能にするソフトウェアのセットアップは、非常に注目に値します。人間は、自分自身の動きとロボットの動きの間のわずかな遅れに非常に敏感です。 Optimus には、人間のポーズをリアルタイムで実行できる流体全身コントローラーが搭載されています。
大規模なフリート: データを並行して収集するには複数のロボット、1 日に複数のシフト (できれば 24 時間) で働く訓練を受けた人間、およびオンコールのメンテナンスが必要です。ロボットが常にビジーであることを保証するチームです。これは、学術研究機関が考慮すらしないほどの運用の複雑さです。
タスクと環境: リモートで何を行うかを把握することも同様に重要です。現在、この作業のほとんどはデモ主導で行われており、ソーシャル メディア ビデオに含めたいタスクに関するデータを収集します。しかし、汎用ロボットの問題を解決するには、タスクの分散と環境を慎重に検討する必要があります。ビデオの 43 秒から 51 秒の部分では、バッテリーの移動、洗濯物の処理、日用品の棚への仕分けなど、工場や家庭の状況を見ることができます。
これは未解決の調査質問です。1,000 のタスクのトレーニング データを収集する予算しかない場合、スキルの伝達と一般化を最大限に高めるために何を選択しますか?
結論: 人型ロボットの問題を解決するには、遠隔操作は必要ですが、十分ではありません。基本的に拡張性がありません。
マスク氏はコメント欄で、今年後半に22の自由度(DoF)を持つオプティマス・ヒューマノイド・ロボット・ハンドの最新目標をプレビューした。これはさらにエキサイティングです。
以前、マスク氏の決算会見での暴露によれば、テスラの人型ロボット「オプティマス」は今年末までに「有用な工場」を完成させる可能性があるという。 「Task」の機能を開発し、今年末までに自社工場で先行して導入する予定だ。同時に、テスラは2025年末までにオプティマスを販売する可能性が高い。
テスラ ヒューマノイド ロボットの「進化の歴史」
テスラ ヒューマノイド ロボットは、2021 年 8 月の「テスラ」に遡ります。 「AIの日」イベントで、マスク氏は人型ロボット(テスラボット)を構築するという自身のアイデアを初めて明らかにした。
この人型ロボットは身長約 1.72 メートル、体重約 112 ポンドで、バランスのとれた体型と顔面スクリーンを備えており、時速約 8 キロメートルで移動できます。 。
#2022 年 10 月、今年の「Tesla AI Day」で、人型ロボット Optimus がデビューしました。当時はダンスなどの芸を披露することはできなかった。このロボットは作業時に 500W の電力を消費し、重量は 73 kg、手の動きの自由度は 27 です。
しかし、オプティマスはデモのデモンストレーションで、箱を動かしたり、花に水をあげたり、テスラ ギガファクトリーで働いたりする写真を見せました。
# 半年以上の休眠期間を経た 2023 年 5 月、テスラ オプティマスはついにスムーズに歩行し、物体をつかむ能力を獲得しました。
# 2023 年 9 月、Tesla Optimus が再び進化し、自律的にオブジェクトを分類できるようになりました。ハイライトは、ニューラルの完全なエンドツーエンド トレーニングです。ネットワーク : 入力ビデオ、出力制御。余暇には、趣味でヨガをすることもできます。
#2023 年 12 月に、第 2 世代のオプティマスが登場し、人々は映画「パブリック エネミー」を本格的に観るようになりました。 「中はこんな感じ。
# 新しいビデオのリリースにより、テスラの人型ロボットの進歩のスピードは再び驚くべきものになっています。
以上がテスラのオプティマス人型ロボットは工場で働き、バッテリーの分解や自己修正に熟練しており、さらに先のことも可能ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

7月4日午後、世界人工知能会議組織委員会事務局の指導の下、世界人工知能会議組織委員会事務局が主催し、国家地方ヒューマノイドロボットイノベーションセンターと中国電子学会が主催して、このサイト「ロボット技術と応用」 本誌との共催による2024年WAIC世界人工知能会議ヒューマノイドロボットと身体性知能開発フォーラムが7月4日午後、上海万博展示コンベンションセンターで開催される。このフォーラムには、人型ロボットと身体化知能分野の国内外の学者、企業代表者、開発者代表者12名が招待され、基調報告、技術共有、円卓会議が行われ、人型ロボットの革新的な成果が発表されました。このフォーラムには、人型ロボットと身体化知能の分野で 200 名を超える専門家の聴衆が集まり、それらは複数のライブ放送プラットフォームを通じてオンラインで視聴されました。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

Huang Renxun 氏は、「AI の次の波はロボットであり、最もエキサイティングな開発の 1 つは人型ロボットです。今日、ProjectGR00T は新たな重要な一歩を踏み出しました。」と述べました。昨日、NVIDIA 創設者 Huang Renxun 氏は、SIGGRAPH2024 の基調講演で、人型ロボットの汎用基本モデル「ProjectGR00T」について語りました。このモデルには、機能面で一連のアップデートが施されています。テキサス大学オースティン校の助教授であり、NVIDIA の上級研究員でもある Zhu Yuke 氏はツイートし、NVIDIA が一般家庭用ロボット向けの大規模シミュレーション トレーニング フレームワークである RoboCasa および MimicGen システムをどのように統合するかをビデオで実演しました。 NVIDIA Omniverse プラットフォームと Isaac マシン

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。
