ホームページ テクノロジー周辺機器 AI GPT4 はロボットにペンを回す方法を教えます。これを「シルクのような滑らかさ」と呼びます。

GPT4 はロボットにペンを回す方法を教えます。これを「シルクのような滑らかさ」と呼びます。

Oct 30, 2023 pm 04:53 PM
ロボット アルゴリズム gpt4

最近、数学者のテレンス タオにインスピレーションを与えた GPT-4 は、チャットでペンを回す方法をロボットに教え始めました

GPT4 はロボットにペンを回す方法を教えます。これを「シルクのような滑らかさ」と呼びます。

このプロジェクトは、NVIDIA によって開発された Agent Eureka と呼ばれています、ペンシルバニア大学、カリフォルニア工科大学、テキサス大学オースティン校が共同開発しました。彼らの研究では、GPT-4 構造の力と強化学習の利点を組み合わせて、Eureka が絶妙な報酬関数を設計できるようにしました。

GPT-4 のプログラミング機能により、Eureka は強力な報酬関数設計スキルを得ることができます。これは、ほとんどのタスクにおいて、エウレカ独自の報酬体系が人間の専門家の報酬体系よりも優れていることを意味します。これにより、ペンを回す、引き出しを開ける、皿のクルミを開くなど、人間では完了するのが難しいいくつかのタスクを完了することができ、さらにはボールを投げたりキャッチしたり、ハサミを操作したりするなど、さらに複雑なタスクを完了することができます。

GPT4 はロボットにペンを回す方法を教えます。これを「シルクのような滑らかさ」と呼びます。写真

GPT4 はロボットにペンを回す方法を教えます。これを「シルクのような滑らかさ」と呼びます。写真

これらは現在シミュレーション環境で行われていますが、これはすでに非常に強力です。

このプロジェクトはオープンソース化されており、プロジェクトのアドレスと論文のアドレスは記事の最後に記載されています。

論文の要点を簡単に要約します。

この論文では、大規模言語モデル (LLM) を使用して機械学習の報酬関数を設計および最適化する方法を検討します。優れた報酬関数を設計すると機械学習モデルのパフォーマンスを大幅に向上させることができるため、これは重要なトピックですが、そのような関数を設計するのは非常に困難です。

研究者らは、EUREKA と呼ばれる新しいアルゴリズムを提案しました。 EUREKA は報酬関数の生成と改善に LLM を採用しています。テストでは、EUREKA は 29 の異なる強化学習環境で人間レベルのパフォーマンスを達成し、タスクの 83% で人間の専門家によって設計された報酬関数を上回りました。

EUREKA は、これまで到達できなかったタスクのいくつかを解決することに成功しました。複雑な操作タスクは、人為的に設計された報酬関数によって解決されました。 、ペンを素早く回すための「シャドウハンド」の手の操作をシミュレートするなど、

#さらに、EUREKA は、より効果的な、人間の期待とより一致した報酬関数を生成できるまったく新しい方法を提供します。

EUREKA の動作方法は、次の 3 つの主要なステップで構成されます。

コンテキストとしての環境: EUREKA は、環境のソース コードをコンテキストとして使用して、実行可能な報酬関数

2 を生成します。進化的探索: EUREKA は進化的探索を通じて報酬関数を継続的に提案および改善します

3. 報酬反映: EUREKA はポリシー トレーニングからの統計データに基づいて報酬の質のテキスト要約を生成し、それによって報酬関数を自動的かつ的を絞って改善します。 3. 報酬の反映: EUREKA は、ポリシー トレーニングからの統計データに基づいて報酬の質のテキスト要約を生成し、報酬関数を自動的かつ的を絞って改善します。

この研究は、強化学習と報酬関数設計の分野に広範な影響を与える可能性があります。報酬関数を自動的に生成および改善する新しい効率的な方法を提供し、多くの場合、この方法のパフォーマンスは人間の専門家のパフォーマンスを超えるため、影響力があります。

プロジェクトアドレス:

https://www.php.cn/link/e6b738eca0e6792ba8a9cbcba6c1881d

紙のリンク:

https://www.php.cn/ link/ce128c3e8f0c0ae4b3e843dc7cbab0f7

以上がGPT4 はロボットにペンを回す方法を教えます。これを「シルクのような滑らかさ」と呼びます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 Mar 26, 2024 pm 12:41 PM

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

二代目アメカ登場!彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 二代目アメカ登場!彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 Mar 04, 2024 am 09:10 AM

人型ロボット「アメカ」が第二世代にバージョンアップ!最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。 「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

AI はどのようにロボットをより自律的で順応性のあるものにすることができるのでしょうか? AI はどのようにロボットをより自律的で順応性のあるものにすることができるのでしょうか? Jun 03, 2024 pm 07:18 PM

産業オートメーション技術の分野では、人工知能 (AI) と Nvidia という無視できない 2 つの最近のホットスポットがあります。元のコンテンツの意味を変更したり、コンテンツを微調整したり、コンテンツを書き換えたり、続行しないでください。「それだけでなく、Nvidia はオリジナルのグラフィックス プロセッシング ユニット (GPU) に限定されていないため、この 2 つは密接に関連しています。」このテクノロジーはデジタル ツインの分野にまで広がり、新たな AI テクノロジーと密接に関係しています。「最近、NVIDIA は、Aveva、Rockwell Automation、Siemens などの大手産業オートメーション企業を含む多くの産業企業と提携に至りました。シュナイダーエレクトリック、Teradyne Robotics とその MiR および Universal Robots 企業も含まれます。最近、Nvidiahascoll

2か月後、人型ロボットWalker Sが服をたたむことができるようになった 2か月後、人型ロボットWalker Sが服をたたむことができるようになった Apr 03, 2024 am 08:01 AM

Machine Power Report 編集者: Wu Xin 国内版の人型ロボット + 大型模型チームは、衣服を折りたたむなどの複雑で柔軟な素材の操作タスクを初めて完了しました。 OpenAIのマルチモーダル大規模モデルを統合したFigure01の公開により、国内同業者の関連動向が注目を集めている。つい昨日、中国の「ヒューマノイドロボットのナンバーワン株」であるUBTECHは、Baidu Wenxinの大型モデルと深く統合されたヒューマノイドロボットWalkerSの最初のデモを公開し、いくつかの興味深い新機能を示した。 Baidu Wenxin の大規模モデル機能の恩恵を受けた WalkerS は次のようになります。 Figure01 と同様に、WalkerS は動き回るのではなく、机の後ろに立って一連のタスクを完了します。人間の命令に従って服をたたむことができる

柔軟かつ高速な 5 本の指を備え、人間のタスクを自律的に完了する初のロボットが登場、大型モデルが仮想空間トレーニングをサポート 柔軟かつ高速な 5 本の指を備え、人間のタスクを自律的に完了する初のロボットが登場、大型モデルが仮想空間トレーニングをサポート Mar 11, 2024 pm 12:10 PM

今週、OpenAI、Microsoft、Bezos、Nvidiaが投資するロボット企業FigureAIは、7億ドル近くの資金調達を受け、来年中に自立歩行できる人型ロボットを開発する計画であると発表した。そしてテスラのオプティマスプライムには繰り返し良い知らせが届いている。今年が人型ロボットが爆発的に普及する年になることを疑う人はいないだろう。カナダに拠点を置くロボット企業 SanctuaryAI は、最近新しい人型ロボット Phoenix をリリースしました。当局者らは、多くのタスクを人間と同じ速度で自律的に完了できると主張している。人間のスピードでタスクを自律的に完了できる世界初のロボットである Pheonix は、各オブジェクトを優しくつかみ、動かし、左右にエレガントに配置することができます。自律的に物体を識別できる

C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

未来を形作る 10 台の人型ロボット 未来を形作る 10 台の人型ロボット Mar 22, 2024 pm 08:51 PM

以下の 10 種類の人型ロボットが私たちの未来を形作ります。 1. ASIMO: ホンダが開発した ASIMO は、最もよく知られている人型ロボットの 1 つです。身長 4 フィート、体重 119 ポンドの ASIMO には、高度なセンサーと人工知能機能が装備されており、複雑な環境をナビゲートし、人間と対話することができます。 ASIMO は多用途性を備えているため、障害を持つ人々の支援からイベントでのプレゼンテーションまで、さまざまなタスクに適しています。 2. Pepper: ソフトバンクロボティクスによって作成された Pepper は、人間の社会的パートナーになることを目指しています。表情豊かな顔と感情を認識する能力を備えた Pepper は、会話に参加したり、小売現場で手助けしたり、教育サポートを提供したりすることもできます。コショウ

See all articles