私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。-AI-php.cn

ChatGPT などの大規模な言語モデルの成功には、優れたプロンプトエンジニアリングが不可欠ですロボットタスク用。残念ながら、Prompt は実証科学であり、この分野の研究者や愛好家を助けるさまざまな例を含む、包括的でアクセスしやすいリソースが不足しています。このギャップを埋めるために、研究者らは、誰もがさまざまなロボットカテゴリのプロンプト戦略の例を共有できる共同オープンソースプラットフォームである「プロンプトクラフト」を導入し、この研究で使用されたすべてのツールを公開しました。

ロボットを研究室から世界へ出動させましょう

ホームページ

テクノロジー周辺機器

私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。

PHPz

Apr 12, 2023 pm 11:55 PM

ロボット chatgpt

人間と同じように、自分の言葉でロボットに何をすべきかを伝えたいと思ったことはありますか?

たとえば、ホームアシスタントロボットに「お弁当を温めてください」と言うだけで、ロボットは自動的に電子レンジを見つけます。すごいですよね？

私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。

言語は人間が自分の意図を表現する最も直観的な方法ですが、長い間、人々はロボットを実装するために依然として手書きのコードに大きく依存していました。。コントロール。しかし、ChatGPTが登場するとこの状況は変わります。

最近の研究では、Microsoft チームは OpenAI の新しい AI 言語モデル ChatGPT を使用して人間とコンピューターの自然な対話を可能にする方法を研究しています。

私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。

紙のリンク: https://www.microsoft.com/en-us/research/uploads/prod/ 2023/02/ChatGPT___Robotics.pdf

ChatGPT は、テキストと人間の対話の大規模なコーパスに基づいてトレーニングされた言語モデルであるため、幅広いプロンプトやプロンプトに対して一貫した文法的な応答を生成できます。質問に対する正しい回答。この研究の目的は、ChatGPT がテキストを超えて考え、現実世界について推論して、ロボットがタスクを完了できるかどうかを確認することです。研究者らは、これにより人々が複雑なプログラミング言語やロボットシステムの詳細を学ばなくても、ロボットとの対話が容易になることを期待している。

研究の主な課題は、物理法則、動作環境、ロボットが体の動きを変更するために使用する方法を考慮して問題を解決する方法を ChatGPT に教えることです。周囲。

ChatGPT は単独で多くのことができることがわかりましたが、それでもまだ支援が必要です。論文の中でチームは、ロボットタスクを解決する際に言語モデルを導くために使用できる一連の設計原則について説明しています。これには、アドホックプロンプト構造、高レベル API、ヒューマンテキストによるフィードバックが含まれますが、これらに限定されません。研究者らは、この研究はロボットシステム開発における変革の始まりに過ぎないと信じており、この研究が他の研究者にこの興味深い研究分野への参加を促すきっかけになればと期待している。

今日のロボット技術が直面する課題と ChatGPT が提供できる支援

現在のロボット操作プロセスは、開始から始まります。エンジニアまたは技術ユーザーは、タスク要件をシステムコードに変換する必要があります。エンジニアはワークフローのループに加わり、ロボットの動作を修正するために常に新しいコードと仕様を作成します。全体として、このプロセスは遅く（ユーザーは低レベルのコードを記述する必要がある）、費用がかかり（ロボット工学に関する深い知識を持つ高度なスキルを持つユーザーが必要）、非効率的です（適切に機能するには複数の対話が必要です）。

私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。

しかし、ChatGPT は新しいボットパラダイムを切り開き、技術者ではない可能性のあるユーザーの参加を可能にします。ループ内でロボットのパフォーマンスを監視しながら、大規模言語モデル (LLM) に高レベルのフィードバックを提供します。研究された設計原則に従うことで、ChatGPT はロボットシナリオのコードを生成できます。この研究では、微調整を行わずに、LLM の知識を活用して、さまざまなタスクに合わせてさまざまなロボットの形状を制御します。研究者らは、その研究の中で、ロボットの課題を解決する ChatGPT の複数の例と、運用、航空、ナビゲーションの各ドメインにおける複雑なロボットの展開を実証しました。

ボットと ChatGPT: 設計原則

LLM のプロンプトは、非常に経験に基づいた科学です。この研究では、試行錯誤を通じてロボットタスクのプロンプトを作成するための一連の方法と設計原則を確立しました。

#まず、調査では一連の高レベルのロボット API または関数ライブラリを定義します。このライブラリは、特定のロボットに固有であり、ロボットの制御スタックまたは認識ライブラリ内の既存の低レベル実装にマップできます。 ChatGPT がその動作を推測できるように、高レベル API にわかりやすい名前を使用することが重要です。

次に、研究者たちは、利用可能な機能を明示的に示しながらタスクの目標を説明する ChatGPT 用のテキストプロンプトを作成しました。プロンプトには、タスクの制約に関する情報や、ChatGPT がその回答を形成する方法 (補助的な解析要素を使用した特定のエンコード言語) に関する情報も含めることができます。私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。

ユーザーは、ループ内で ChatGPT のコード出力を直接検査するか、またはエミュレータを使用します。必要に応じて、ユーザーは自然言語を使用して回答の品質と安全性に関するフィードバックを ChatGPT に提供できます。

ユーザーがソリューションに満足したら、最終的にコードをロボットにデプロイできます。
理論はこれくらいにして、ChatGPT では具体的に何ができるのでしょうか?

いくつかの例を見てみましょう。コードリポジトリでさらに多くのケーススタディを見つけることができます。

ゼロサンプルミッションプラン

研究者らは ChatGPT で実際のドローンを制御できるようにし、技術者以外のユーザーやユーザーにとって最適であることが証明されました。ロボット非常に直感的な言語ベースのインターフェイス。ユーザーの指示があいまいな場合、ChatGPT は明確な質問をし、ドローンがジグザグパターンなどのアーキテクチャを視覚的に検査できるように複雑なコード構造を作成します。セルフィーの撮り方も学びました！

研究者チャットGPT Microsoft AirSim シミュレーターを使用した模擬産業検査シナリオでも使用されました。このモデルは、ユーザーの高レベルの意図と幾何学的な手がかりを効果的に解析して、ドローンを正確に制御することができます。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃ループの中ユーザー: 複雑なタスクに対話が必要な場合

#次に、研究者らはロボットアーム操作シナリオに ChatGPT を使用し、会話型フィードバックを使用して、最初に提供された API 構成をより多くの API 構成に変換する方法をモデルに教えました。複雑な高レベル関数: ChatGPT 自動プログラミング。このモデルは、ブロックを積み上げるなどのアクションを実行するためのカリキュラムベースの戦略を使用して、学習したスキルを論理的にリンクできます。

さらに、このモックアップは、木のブロックから Microsoft ロゴを作成するときに、テキスト領域と物理領域を接続する完璧な例を示しています。内部のナレッジベースからロゴを呼び出すことができるだけでなく、ロゴを (SVG コードとして) 「描画」し、上で学習したスキルを使用して、既存のロボットの動作のどれがそのロボットの動作を構成できるかを判断することもできます。外観。

次に、研究者らは ChatGPT に、ドローンが到達できるようにするアルゴリズムを書くように依頼しました。障害物に当たらないように空中で狙いを定めましょう。彼らは、ドローンが前向きの距離センサーを備えていることをモデルに伝え、ChatGPT がアルゴリズムの主要な構成要素のほとんどを即座にプログラムしました。このタスクには人間との会話が必要ですが、言語的なフィードバックのみを使用してローカライズされたコードを改善できる ChatGPT の機能は印象的です。

知覚-行動ループ: ロボットは行動する前に世界を認識します

何かをする (行動する) 前に世界を認識する (知覚) 能力) これはあらゆるロボットシステムの基礎です。そこで研究者らは、この概念に対する ChatGPT の理解をテストすることにし、ユーザーが指定したオブジェクトが見つかるまで環境を探索するよう ChatGPT に依頼しました。この調査では、モデルに物体検出や物体距離 API などの機能を提供し、生成されるコードがセンスとアクションのループを正常に実装していることを検証します。

実験段階で、研究者らは、ChatGPT が (ChatGPT にコードを生成させるのではなく) センサーのフィードバックに基づいてロボットがどこに行くべきかをリアルタイムで決定できるかどうかを評価するために追加の実験を実施しました。決定を行うループ) これらの決定)。興味深いことに、カメラ画像のテキストによる説明を会話の各ステップに入力できることが偶然にも検証され、モデルは特定のオブジェクトに到達するまでロボットを制御する方法を理解できました。

PromptCraft、LLM ロボット工学研究のための共同オープンソースツール

ChatGPT などの大規模な言語モデルの成功には、優れたプロンプトエンジニアリングが不可欠ですロボットタスク用。残念ながら、Prompt は実証科学であり、この分野の研究者や愛好家を助けるさまざまな例を含む、包括的でアクセスしやすいリソースが不足しています。このギャップを埋めるために、研究者らは、誰もがさまざまなロボットカテゴリのプロンプト戦略の例を共有できる共同オープンソースプラットフォームである「プロンプトクラフト」を導入し、この研究で使用されたすべてのツールを公開しました。

プロンプトの設計に加えて、研究では、ユーザーが ChatGPT で生成されたアルゴリズムをテストできるようにする複数のボットシミュレーターとインターフェイスを含めたいと考えています。研究の手始めとして、誰でもこれらのアイデアを開発するために使用できる ChatGPT と統合された AirSim 環境もリリースされました。

#
ChatGPT-AirSim インターフェイス

ロボットを研究室から世界へ出動させましょう

これらのテクノロジーのリリースには価値がありますこれはロボット工学の聴衆を広げることになるからです。マイクロソフトの研究者らは、言語ベースのロボット制御が科学研究室のロボットを日常ユーザーの生活に導入するための基盤となると考えている。

この記事では、ChatGPT の出力は、注意深く分析せずにロボットに直接デプロイすることを意図したものではないことを強調したいと思います。研究者らはユーザーに対し、現実の展開の可能性がある前にこれらのアルゴリズムを評価するためにシミュレーションの力を活用し、常に必要な安全対策を講じることを推奨しています。この記事で説明した研究は、ロボット工学の分野で動作する大規模な言語モデルの交差点で可能なことのほんの一部にすぎず、さらなる研究へのインスピレーションを提供することを願っています。

元のリンク: https://www.microsoft.com/en-us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/

以上が私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7529

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

ChatGPT では、無料ユーザーが 1 日あたりの制限付きで DALL-E 3 を使用して画像を生成できるようになりました Aug 09, 2024 pm 09:37 PM

DALL-E 3は、前モデルより大幅に改良されたモデルとして2023年9月に正式導入されました。これは、複雑な詳細を含む画像を作成できる、これまでで最高の AI 画像ジェネレーターの 1 つと考えられています。ただし、発売当初は対象外でした

二代目アメカ登場！彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 Mar 04, 2024 am 09:10 AM

人型ロボット「アメカ」が第二世代にバージョンアップ！最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

AI はどのようにロボットをより自律的で順応性のあるものにすることができるのでしょうか? Jun 03, 2024 pm 07:18 PM

産業オートメーション技術の分野では、人工知能 (AI) と Nvidia という無視できない 2 つの最近のホットスポットがあります。元のコンテンツの意味を変更したり、コンテンツを微調整したり、コンテンツを書き換えたり、続行しないでください。「それだけでなく、Nvidia はオリジナルのグラフィックスプロセッシングユニット (GPU) に限定されていないため、この 2 つは密接に関連しています。」このテクノロジーはデジタルツインの分野にまで広がり、新たな AI テクノロジーと密接に関係しています。「最近、NVIDIA は、Aveva、Rockwell Automation、Siemens などの大手産業オートメーション企業を含む多くの産業企業と提携に至りました。シュナイダーエレクトリック、Teradyne Robotics とその MiR および Universal Robots 企業も含まれます。最近、Nvidiahascoll

2か月後、人型ロボットWalker Sが服をたたむことができるようになった Apr 03, 2024 am 08:01 AM

Machine Power Report 編集者: Wu Xin 国内版の人型ロボット + 大型模型チームは、衣服を折りたたむなどの複雑で柔軟な素材の操作タスクを初めて完了しました。 OpenAIのマルチモーダル大規模モデルを統合したFigure01の公開により、国内同業者の関連動向が注目を集めている。つい昨日、中国の「ヒューマノイドロボットのナンバーワン株」であるUBTECHは、Baidu Wenxinの大型モデルと深く統合されたヒューマノイドロボットWalkerSの最初のデモを公開し、いくつかの興味深い新機能を示した。 Baidu Wenxin の大規模モデル機能の恩恵を受けた WalkerS は次のようになります。 Figure01 と同様に、WalkerS は動き回るのではなく、机の後ろに立って一連のタスクを完了します。人間の命令に従って服をたたむことができる

柔軟かつ高速な 5 本の指を備え、人間のタスクを自律的に完了する初のロボットが登場、大型モデルが仮想空間トレーニングをサポート Mar 11, 2024 pm 12:10 PM

今週、OpenAI、Microsoft、Bezos、Nvidiaが投資するロボット企業FigureAIは、7億ドル近くの資金調達を受け、来年中に自立歩行できる人型ロボットを開発する計画であると発表した。そしてテスラのオプティマスプライムには繰り返し良い知らせが届いている。今年が人型ロボットが爆発的に普及する年になることを疑う人はいないだろう。カナダに拠点を置くロボット企業 SanctuaryAI は、最近新しい人型ロボット Phoenix をリリースしました。当局者らは、多くのタスクを人間と同じ速度で自律的に完了できると主張している。人間のスピードでタスクを自律的に完了できる世界初のロボットである Pheonix は、各オブジェクトを優しくつかみ、動かし、左右にエレガントに配置することができます。自律的に物体を識別できる

携帯電話にchatgptをインストールする方法 Mar 05, 2024 pm 02:31 PM

インストール手順: 1. ChatGTP ソフトウェアを ChatGTP 公式 Web サイトまたはモバイルストアからダウンロードします; 2. それを開いた後、設定インターフェイスで言語を中国語を選択します; 3. ゲームインターフェイスでヒューマンマシンゲームを選択し、中国スペクトル; 4 . 起動後、チャットウィンドウにコマンドを入力してソフトウェアを操作します。

未来を形作る 10 台の人型ロボット Mar 22, 2024 pm 08:51 PM

以下の 10 種類の人型ロボットが私たちの未来を形作ります。 1. ASIMO: ホンダが開発した ASIMO は、最もよく知られている人型ロボットの 1 つです。身長 4 フィート、体重 119 ポンドの ASIMO には、高度なセンサーと人工知能機能が装備されており、複雑な環境をナビゲートし、人間と対話することができます。 ASIMO は多用途性を備えているため、障害を持つ人々の支援からイベントでのプレゼンテーションまで、さまざまなタスクに適しています。 2. Pepper: ソフトバンクロボティクスによって作成された Pepper は、人間の社会的パートナーになることを目指しています。表情豊かな顔と感情を認識する能力を備えた Pepper は、会話に参加したり、小売現場で手助けしたり、教育サポートを提供したりすることもできます。コショウ

この人型ロボットは魔法を使うことができます。春祭り祝賀プログラムチームに詳細を調べてもらいましょう Feb 04, 2024 am 09:03 AM

瞬く間に、ロボットは魔法を使えるようになったのでしょうか？最初にテーブルの上の水スプーンを取り上げ、中には何も入っていないことを観客に証明したのが見られました。次に、卵のような物体を手に置き、水スプーンをテーブルに戻し、が「呪文を唱え」始めました… …再び水スプーンを拾ったそのとき、奇跡が起こりました。元々入っていた卵が消えて、飛び出してきたのがバスケットボールに… もう一度連続動作を見てみましょう： △ このアニメーションは一連の動作を2倍速で表示しており、スムーズに流れています。ビデオを 0.5 倍速で繰り返し再生すると、うまくいくでしょうか? 最後に、手の速度がもっと速ければ、敵から隠すことができるかもしれないという手がかりを発見しました。一部のネチズンは、ロボットの魔法のスキルが自分たちのものよりもさらに高いと嘆いていました。マグは私たちのためにこの魔法を実行してくれたのです。

See all articles

私がまだ ChatGPT でチャットしている間に、誰かがすでに ChatGPT を使用してロボットの動作を制御し始めていました。

今日のロボット技術が直面する課題と ChatGPT が提供できる支援

ボットと ChatGPT: 設計原則

理論はこれくらいにして、ChatGPT では具体的に何ができるのでしょうか?

ゼロサンプル ミッション プラン

ロボットを研究室から世界へ出動させましょう

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

ゼロサンプルミッションプラン