メタ研究者がロボットの視覚操作を可能にする人工視覚野を作成
Meta Corporation の AI 研究部門の研究者は最近、ロボットの適応スキル調整と視覚野の複製における重要な進歩を発表する発表を行いました。これらの進歩により、現実世界からデータを取得することなく、AIを搭載したロボットが視覚を通じて現実世界で動作できるようになったという。
これは、人間の介入なしで動作し、現実世界と対話できる汎用の「身体型 AI」ロボットの作成における大きな進歩であると彼らは主張しています。研究者らはまた、世界中の何千人もの研究参加者の日常活動を記録するEgo4Dデータセットで訓練された「VC-1」と呼ばれる人工視覚野を作成したとも述べた。
研究者らが以前に公開したブログ投稿で説明したように、視覚野は生物が視覚を動きに変換できるようにする脳の領域です。したがって、人工視覚野を持つことは、目の前のシーンに基づいてタスクを実行する必要があるロボットにとって重要な要件です。
「VC-1」の人工視覚野は、さまざまな環境でさまざまな感覚運動タスクを適切に実行する必要があるため、研究参加者が含まれる Ego4D データセットは特に重要な役割を果たします。ユーザーはウェアラブルを使用します。カメラを使用して、料理、掃除、運動、工作などの日常の活動を何千時間ものビデオで記録します。
研究者らは次のように述べています:「生物には普遍的な視覚野があり、それが私たちが探している具現化エージェントです。したがって、私たちはEgo4Dを中核として、複数のタスクでうまく機能するデータセットの作成に着手しました」 「Ego4D は料理、園芸、工芸などの日常的な活動に主に焦点を当てているため、家やアパートを探索する自己中心的なビデオのデータセットも採用しました。」
ただし、視覚野は「具体的な AI」の一要素にすぎず、ロボットが現実世界で完全に自律的に動作するには、現実世界の物体を操作できなければなりません。ロボットは、物体をナビゲートし、見つけて運び、別の場所に移動し、正しく配置するために視覚を必要とします。これらすべての動作は、見聞きしたことに基づいて自律的に実行されます。
この問題を解決するために、Meta の AI 専門家はジョージア工科大学の研究者と協力して、ロボットがトレーニングをシミュレートし、これらのスキルを現実世界に再現するために使用するアダプティブ スキル コーディネーション (ASC) と呼ばれる新しいテクノロジーを開発しました。ロボット。
Meta は、Boston Dynamics とも協力して、ASC テクノロジーの有効性を実証しました。両社は、ASC テクノロジーとボストン ダイナミクスの Spot ロボットを組み合わせて、同社のロボットに強力なセンシング、ナビゲーション、および操作機能を提供しましたが、それには人間の大幅な介入も必要でした。たとえば、オブジェクトを選択するには、誰かがロボットのタブレットに表示されているオブジェクトをクリックする必要があります。
研究者らは記事の中で次のように書いています:「私たちの目標は、Boston Dynamics API を介してオンボードセンシングとモーターコマンドから世界を認識できる AI モデルを構築することです。」
スポットロボットテストはこの実験は、HM3D および 1,000 軒を超える住宅の屋内 3D スキャン データを含む ReplicaCAD データセットで構築されたシミュレーション環境である Habitat シミュレーターを使用して実施されました。その後、Spot ロボットは、これまで見たことのない家の周りを移動し、物体を運び、適切な場所に配置するように訓練されました。訓練されたスポット ロボットによって得られた知識と情報は、現実世界で動作するスポット ロボットに複製され、家のレイアウトに関する知識に基づいて同じタスクを自動的に実行します。
私たちは、家具完備の 185 平方メートルのアパートと 65 平方メートルの大学の研究室という 2 つの非常に異なる現実世界の環境を使用しました。 「さまざまなアイテムの再配置が必要でした。全体として、ASC テクノロジーを搭載した Spot ロボットは、ほぼ完璧に動作し、60 回のテスト中 59 回成功し、ハードウェアの不安定性、ピッキングの失敗、移動を克服しました。障害物や経路の遮断などの敵対的な干渉も克服しました。」とメタ研究者は述べています。 VC-1 モデルのソース コードも公開し、モデル サイズのスケーリング方法を別の論文で共有したこと、データ セット サイズなどの詳細についても説明しました。それまでの間、チームの次の焦点は、VC-1 と ASC を統合して、より人間に近い表現型 AI システムを作成することです。
以上がメタ研究者がロボットの視覚操作を可能にする人工視覚野を作成の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











C言語関数は再利用可能なコードブロックです。彼らは入力を受け取り、操作を実行し、結果を返すことができます。これにより、再利用性が改善され、複雑さが軽減されます。関数の内部メカニズムには、パラメーターの渡し、関数の実行、および戻り値が含まれます。プロセス全体には、関数インラインなどの最適化が含まれます。単一の責任、少数のパラメーター、命名仕様、エラー処理の原則に従って、優れた関数が書かれています。関数と組み合わせたポインターは、外部変数値の変更など、より強力な関数を実現できます。関数ポインターは機能をパラメーターまたはストアアドレスとして渡し、機能への動的呼び出しを実装するために使用されます。機能機能とテクニックを理解することは、効率的で保守可能で、理解しやすいCプログラムを書くための鍵です。

c言語関数の返品値タイプには、int、float、double、char、void、およびポインタータイプが含まれます。 intは整数を返すために使用され、フロートとダブルはフロートを返すために使用され、charは文字を返します。 voidとは、関数が値を返さないことを意味します。ポインタータイプはメモリアドレスを返し、メモリの漏れを避けるように注意してください。構造またはコンソーシアムは、複数の関連データを返すことができます。

C35の計算は、本質的に組み合わせ数学であり、5つの要素のうち3つから選択された組み合わせの数を表します。計算式はC53 = 5です! /(3! * 2!)。これは、ループで直接計算して効率を向上させ、オーバーフローを避けることができます。さらに、組み合わせの性質を理解し、効率的な計算方法をマスターすることは、確率統計、暗号化、アルゴリズム設計などの分野で多くの問題を解決するために重要です。

CとC#には類似点がありますが、それらは完全に異なります。Cはプロセス指向の手動メモリ管理、およびシステムプログラミングに使用されるプラットフォーム依存言語です。 C#は、デスクトップ、Webアプリケーション、ゲーム開発に使用されるオブジェクト指向のガベージコレクション、およびプラットフォーム非依存言語です。

std :: uniqueは、コンテナ内の隣接する複製要素を削除し、最後まで動かし、最初の複製要素を指すイテレーターを返します。 STD ::距離は、2つの反復器間の距離、つまり、指す要素の数を計算します。これらの2つの機能は、コードを最適化して効率を改善するのに役立ちますが、隣接する複製要素をstd ::のみ取引するというような、注意すべき落とし穴もあります。 STD ::非ランダムアクセスイテレーターを扱う場合、距離は効率が低くなります。これらの機能とベストプラクティスを習得することにより、これら2つの機能の力を完全に活用できます。

C関数定義の重要な要素には、リターンタイプ(関数によって返される値の定義)、関数名(命名仕様に続き、スコープの決定)、パラメーターリスト(関数で受け入れられたパラメータータイプ、数量、順序の定義)、および関数本文(関数のロジックの実装)が含まれます。これらの要素の意味と微妙な関係を明確にすることが重要であり、開発者が「ピット」を回避し、より効率的でエレガントなコードを書くのに役立ちます。

関数ポインターは関数へのポインターであり、ポインター関数はポインターを返す関数です。関数ポインターは、異なる関数を選択および実行するために使用される関数を指します。ポインター関数は、ポインターを変数、配列、またはその他の機能に戻します。関数ポインターを使用する場合、ポインターヌル値のマッチングとチェックに注意してください。ポインター関数を使用する場合は、メモリ管理に注意し、動的に割り当てられたメモリを無料で割り当てます。混乱やエラーを避けるために、2つの違いと特性を理解してください。

アルゴリズムは、問題を解決するための一連の指示であり、その実行速度とメモリの使用量はさまざまです。プログラミングでは、多くのアルゴリズムがデータ検索とソートに基づいています。この記事では、いくつかのデータ取得およびソートアルゴリズムを紹介します。線形検索では、配列[20,500,10,5,100,1,50]があることを前提としており、数50を見つける必要があります。線形検索アルゴリズムは、ターゲット値が見つかるまで、または完全な配列が見られるまで配列の各要素を1つずつチェックします。アルゴリズムのフローチャートは次のとおりです。線形検索の擬似コードは次のとおりです。各要素を確認します:ターゲット値が見つかった場合:return true return false c言語実装:#include#includeintmain(void){i
