人間のような能力を備えた AI: あらゆる物体をアモーダルに追跡
ウェブマスター ホーム (ChinaZ.com) 12 月 25 日のニュース: あらゆるオブジェクトの追跡 Amodally は、人工知能が人間のように動作できるようにするために、カーネギー メロン大学とトヨタ研究所によって開発されたプロジェクトです。オブジェクト全体を追跡します。部分的に隠れていたり、完全に見えていない場合でも、その完全な構造を理解できます。
このプロジェクトでは、部分的に遮られたオブジェクトの完全な形状と位置を「理解」し、追跡するようにコンピューターをトレーニングしました。これは、複雑な環境で部分的に遮られた歩行者や他の車両をより安全かつ確実に識別して追跡できるため、自動運転車にとって非常に重要です。
コードリンク: https://github.com/WesleyHsieh0806/TAO-Amodal
オブジェクト追跡技術を向上させるために、彼らは TAO-Amodal と呼ばれるデータセットを特別に設計しました。このデータセットには、さまざまな遮蔽されたオブジェクトや部分的に見えるオブジェクトを含む多数のビデオ シーケンスが含まれており、部分的にしか見えないオブジェクトを人工知能がよりよく理解して追跡できるようにするための詳細な注釈情報が提供されます
TAO-Amodal データセットには、数千のビデオ シーケンスをカバーする 880 の異なるカテゴリが含まれています。データセットには、完全に見えないオブジェクト、部分的にボックス外のオブジェクト、および遮蔽されたオブジェクトのモーダル境界ボックスとモーダル境界ボックスが含まれています。このデータセットの主な目的は、任意のオブジェクトのアモーダル知覚を追跡することによって、オクルージョン推論における現在のトラッカーの機能を評価することです。
さらに、このプロジェクトでは、オブジェクト トラッカーの機能を強化するために、「Amodal Expander プラグイン」と呼ばれる軽量モジュールも開発されました。このプラグインは、標準の Modal トラッカーを Amodal トラッカーに変換し、部分的に隠れているオブジェクトや完全に表示されていないオブジェクトを追跡するときに、より効率的かつ正確になります。
TAO-Amodal データセットのテスト結果によると、このテクノロジーは、遮蔽されたオブジェクトの検出と追跡において 3.3% と 1.6% の改善を達成しました。特に人物追跡に関しては、既存のモーダル追跡技術と比較して性能が2倍向上しました。このプロジェクトの成功により、コンピューター ビジョン システムの知能が大幅に向上し、遮蔽された物体を扱う際により人間らしくなり、それによって自動運転やビデオ監視などの分野でより大きな役割を果たすことになります。以上が人間のような能力を備えた AI: あらゆる物体をアモーダルに追跡の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

OpenaiのO1:12日間の贈り物は、これまでで最も強力なモデルから始まります 12月の到着は、世界の一部の地域で雪片が世界的に減速し、雪片がもたらされますが、Openaiは始まったばかりです。 サム・アルトマンと彼のチームは12日間のギフトを立ち上げています

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)
