ホームページ ハードウェアチュートリアル ハードウェアのレビュー 2か月後、人型ロボットWalker Sが服をたたむことができるようになった

2か月後、人型ロボットWalker Sが服をたたむことができるようになった

Apr 03, 2024 am 08:01 AM
ロボット 百度 最良の選択 美しい写真 配置 the ウー・シン

Machine Energy Report

編集者: Wu Xin

国内版の人型ロボットは大型モデルと連携し、衣服を折りたたむなどの複雑で柔軟な素材の操作タスクを完了しました。初めて。

OpenAIマルチモーダル大規模モデルを組み込んだ図01の公開により、関連する国内同業他社の進捗が注目を集めています。

つい昨日、「中国初の人型ロボット株」であるUBTECHは、Baidu Wenxinの大型モデルと深く統合された後の人型ロボットWalker Sの最初のデモを公開し、いくつかの興味深い新機能を示しました。

Baidu Wenxin の大規模モデル機能の恩恵を受けた Walker S は次のようになります。

2 个月不见,人形机器人 Walker S 会叠衣服了

図 01 のように、Walker S は動き回らず、机の後ろに立って一連のタスクを完了します。人間の命令に従い、服をたたむことができます。

タスクを完了した後も、そのタスクとチャットすることができます。たとえば、この黒いトップスには何を着たらいいでしょうか?ロボットはあなたが出張に行くことを覚えているので、フォーマルな場面に適した濃い色のパンツと合わせるのがおすすめです。

テーブル上のさまざまなスイッチもプレートに配置されます。

置いたスイッチがテーブルの上に放り戻されたり、届きそうになったソケットが再び外されたりするなど、外乱が発生した場合でも、ウォーカーSはリアルタイムに動作状況を調整し、作業を完了することができます。新しい状況に応じて作業を行います。

ウォーカー S は 2 月に、新エネルギー車の工場での実践的なトレーニングで、マルチモーダルな知覚と動作制御の能力をすでに実証しました。

今回、Wenxin 大型モデルとの徹底的な統合により、Walker S の認知能力と制御能力は新たなレベルに到達し、高度な意図理解ときめ細かいタスク計画能力を獲得しただけでなく、初めて服をたたむなど、複雑で柔軟な素材の操作作業。

Wenxin 大型モデルは、Wenxin の産業レベルの知識強化大型モデルであり、クロスモーダルおよびクロス言語の深い意味理解と生成機能に加え、知識推論、タスク計画などの機能を備えています。これらの機能を人型ロボットに移植することで、ロボットは人間と同じように衣服の素材、形状、シワなどを分析・理解し、これまでの経験に基づいて最適な衣服のたたみ方や順序を導き出すことができます。実際に服をたたむ過程で、ロボットは服の状態変化をリアルタイムで分析し、それに応じて行動戦略を調整します。

オブジェクト干渉選別タスクでも、ウォーカー S は「AI 大型モデル ロボット」の協調利点を最大限に発揮しました。まず、デバイス上のマルチモーダル知覚モデルを通じてオブジェクトの空間位置情報と意味情報が取得され、次にその情報が大規模モデルに渡されてインテリジェント処理が行われ、後者は優れたタスク分解機能によりウォーカー S を迅速に構築します。論理的推論機能により、最適なタスクの計画と実行パスを見つけます。 Walker S は、このソリューションをロボット アームと器用な手の実際の制御にマッピングし、最終的に一連の複雑なタスク全体を正常に完了します。

この動きは、国内の同業者間で同様の機能を実証する最初の例でもあり、その革新的なアプリケーションと実装の難易度は、世界的にも業界の最初の段階にあります。 「FigureとOpenAIの協力や、Baiduとの協力を含む多くのデモンストレーションにおいて、エンドツーエンドは今や達成可能だ」とUBTECH経営陣は昨夜の業績評価および展望会議でチャイナ・ビジネス・ニュースに語った。

" 私たちは、Baidu の大規模モデルを使用して、タスクの分解、自然言語の理解、論理的な配置の順序付けを行います。オープンソース モデルのトレーニングに基づいて会社が構築した、クライアントとサイドに基づくマルチモーダルな大規模モデルに加えて、昨年、人型ロボット市場の競争がますます激化する将来、強力な提携だけが 1 1 > 2 を達成できると我々は信じています。」今回の提携について説明する際、UBTECH 経営陣は「外国のテスラは大きなモデル能力を持っている」と述べました。 OpenAI、NVIDIA、Figure などを組み合わせると、協力して人型ロボットの実装に強力な技術サポートを提供できることがわかります。」

しかし、OpenAI のビデオを比較すると、ウォーカーSはやはり図01とは違いギャップがあります。

最も明らかなことは、アクションのスピードです。さらに、指示の内容に関しては、通常、Walker S が受け取る指示は比較的明確かつ具体的ですが、Figure 01 は常識的な推論を通じて、より抽象的な指示を合理的で実行可能な具体的な操作に変換できます。

さらに、図 01 は作業中にチャット (特に操作の説明) することができ、短期記憶能力があり、以前の会話の内容に基づいて現在の行動を合理的に計画することができます。

生成 AI における競争がますます激化し、研究の焦点が長文テキストやマルチモダリティから身体化された知能にまで広がるにつれ、将来の人型ロボットはもはや静的データの認識に限定されなくなると信じる理由ができました。 , しかし、それは、仮想または現実の 3 次元の世界で自由に移動し、環境と対話する能力です。これは、単純な機械学習から人間のような複雑なタスクの実行への AI の大きな飛躍でもあります。

実際、人型ロボットトラックは過去6か月で非常に熱い勢いを示しており、国内外でプロトタイプが頻繁に公開され、スタートアップ企業が積極的に資金調達を行っています。 UBTECHは2月、NIOの新エネルギー車工場でシートベルトの点検や車両のロゴ貼り付けなどの作業をスムーズに完了できるウォーカーSの試用ビデオを公開した。 UBTECHの株価も3月初旬の2日間で200%上昇した。

しかし、地球規模の人型ロボットはまだ試験段階にあり、規模を拡大するにはまだ時間がかかります。結局のところ、デモと実際のアプリケーションには大きな違いがあり、後者は信頼性、安定性、コストなどの一連の要素を総合的に考慮する必要があります。 UBTECHは、大型AIモデルと人型ロボットの組み合わせにより、後者の知能レベルとマルチシナリオタスクへの適応性が大幅に向上し、産業化プロセスが加速すると述べた。創設者の周建氏はまた、今年末までに工場で人型ロボットの最初のバッチを完成させ、テストに合格し、2025年の人型ロボットの大量発生に備えたいと公に述べた。さらに、UBTECHは今年末までに、大型モデルを搭載し、ユーザーと対話し、短期および長期の記憶を形成できる家庭用感情伴奏型ヒューマノイドロボットの第一世代を発売する予定である。 。

参考リンク

https://www.stcn.com/article/detail/1164967.html

最後に

この一般の方に連絡してください。転載許可番号

記事を投稿または取材を希望する場合: content@jiqizhixin.com

以上が2か月後、人型ロボットWalker Sが服をたたむことができるようになったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ファーウェイのQiankun ADS3.0インテリジェント運転システムは8月に発売され、初めてXiangjie S9に搭載される ファーウェイのQiankun ADS3.0インテリジェント運転システムは8月に発売され、初めてXiangjie S9に搭載される Jul 30, 2024 pm 02:17 PM

7月29日、AITO Wenjieの40万台目の新車のロールオフ式典に、ファーウェイの常務取締役、ターミナルBG会長、スマートカーソリューションBU会長のYu Chengdong氏が出席し、スピーチを行い、Wenjieシリーズモデルの発売を発表した。 8月にHuawei Qiankun ADS 3.0バージョンが発売され、8月から9月にかけて順次アップグレードが行われる予定です。 8月6日に発売されるXiangjie S9には、ファーウェイのADS3.0インテリジェント運転システムが初搭載される。 LiDARの支援により、Huawei Qiankun ADS3.0バージョンはインテリジェント運転機能を大幅に向上させ、エンドツーエンドの統合機能を備え、GOD(一般障害物識別)/PDP(予測)の新しいエンドツーエンドアーキテクチャを採用します。意思決定と制御)、駐車スペースから駐車スペースまでのスマート運転のNCA機能の提供、CAS3.0のアップグレード

Deepseek Webバージョンの入り口Deepseek公式ウェブサイトの入り口 Deepseek Webバージョンの入り口Deepseek公式ウェブサイトの入り口 Feb 19, 2025 pm 04:54 PM

DeepSeekは、Webバージョンと公式Webサイトの2つのアクセス方法を提供する強力なインテリジェント検索および分析ツールです。 Webバージョンは便利で効率的であり、公式ウェブサイトは包括的な製品情報、ダウンロードリソース、サポートサービスを提供できます。個人であろうと企業ユーザーであろうと、DeepSeekを通じて大規模なデータを簡単に取得および分析して、仕事の効率を向上させ、意思決定を支援し、イノベーションを促進することができます。

Apple iPhone 16 には Apple Intelligence がプリインストールされなくなりました Apple iPhone 16 には Apple Intelligence がプリインストールされなくなりました Jul 30, 2024 pm 01:18 PM

業界関係者のマーク・ガーマン氏によると、AppleのApple Intelligenceは10月に延期される予定だという。つまり、iOS18.1では最初にプッシュされることになります。 Apple iPhone 16は9月に発売される予定のため、Apple Intelligenceはプリインストールされません。 1. Apple Intelligence Apple Intelligence は、強力な生成モデルを使用して、ユーザーのコミュニケーション、作業、表現を支援する新しい機能を iPhone、iPad、Mac に提供するパーソナル インテリジェンス システムです。 2. 自然言語の理解 Apple Intelligence に組み込まれた大規模なモデルは、言語の意味を深く理解しています。

iOS 18.1が登場し、通話録音が可能になりました! iOS 18.1が登場し、通話録音が可能になりました! Jul 30, 2024 pm 09:35 PM

今朝早く、Apple は iOS 18.1、iPadOS 18.1、macOS Sequoia 15.1 の最初の開発者向けベータ版を開発者にプッシュしました。同時に、Apple は iOS17.6、iPadOS17.6、visionOS1.3、macOS14.6、tvOS17.6、watchOS10.6 の正式バージョンもプッシュしました。 iOS18.1Beta1ではついに通話録音機能が開始され、中国とEU以外の地域でもApple Intelligence機能が開始されました。 iOS18.1Beta1のバージョン番号は22B5007pで、OTAアップグレードのサイズは約637MBです(アップデートパッケージのサイズはモデルによって若干異なります)。

Appleが折りたたみ式スクリーンiPhoneを発売することをサプライチェーンが確認 Appleが折りたたみ式スクリーンiPhoneを発売することをサプライチェーンが確認 Jul 31, 2024 am 01:06 AM

Apple は長年にわたり非折りたたみスクリーン戦略を堅持しており、ユニークなようです。しかし最近、Apple が折りたたみスクリーンの分野に参入しようとしているという噂が徐々に加熱してきました。サプライチェーンからの最新ニュースによると、Apple は折りたたみスクリーン iPhone の発売を準備しており、2026 年が重要な時期となる可能性があると予想されています。 iPhone の今後の発展の見通し イメージング技術と AI 大型モデルへの投資の増加 高リフレッシュレート画面の完全な適用は折りたたみ式 iPhone のサプライチェーンに遅れをとっている。最近のリリースではなく、発売日は早ければ2026年になる可能性がある サムスンのZFlipシリーズ折りたたみフォームの変数と重要性から学ぶ プロジェクトの調整またはキャンセルの可能性 リリースの成功はiPhone開発のマイルストーンとなる

世界のトップ10の仮想通貨取引プラットフォームのトップ10のランキングは何ですか? 世界のトップ10の仮想通貨取引プラットフォームのトップ10のランキングは何ですか? Feb 20, 2025 pm 02:15 PM

暗号通貨の人気により、仮想通貨取引プラットフォームが登場しています。世界の上位10の仮想通貨取引プラットフォームは、トランザクションの量と市場シェアに従って次のようにランク付けされています:Binance、Coinbase、FTX、Kucoin、Crypto.com、Kraken、Huobi、Gate.io、Bitfinex、Gemini。これらのプラットフォームは、幅広い暗号通貨の選択から、さまざまなレベルのトレーダーに適したデリバティブ取引に至るまで、幅広いサービスを提供しています。

AIツールのおすすめ AIツールのおすすめ Nov 29, 2024 am 11:08 AM

この記事では、Douyin Doubao、Wenxin Yige、Tencent Zhiying、Baidu Feipiao EasyDL、Baidu AI Studio、iFlytek Spark Cognitive Large Model を含む 6 つの人気 AI ツールを紹介します。これらのツールは、テキスト作成、画像生成、ビデオ編集、AI モデル開発などのさまざまな機能をカバーしています。適切な AI ツールを選択するには、機能要件、技術レベル、コスト予算などの要素を考慮する必要があります。これらのツールは、AI 支援を必要とする個人や企業に便利で効率的なソリューションを提供します。

AIツールとは何ですか? AIツールとは何ですか? Nov 29, 2024 am 11:11 AM

AI ツールには、Doubao、ChatGPT、Gemini、BlenderBot などが含まれます。

See all articles