ホームページ テクノロジー周辺機器 AI 「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

Mar 08, 2024 pm 03:46 PM
ai 電車

オクルージョンは、コンピュータ ビジョンにおける最も基本的でありながら未解決の問題の 1 つです。オクルージョンとは視覚情報の欠如を意味しますが、マシン ビジョン システムは知覚と理解のために視覚情報に依存しており、実際には世界では、オブジェクト間の相互オクルージョンがあらゆる場所で発生します。オックスフォード大学の VGG 研究所の Andrew Zisserman チームの最新の研究では、任意のオブジェクトのオクルージョン完了の問題を体系的に解決し、この問題に対する新しくてより正確な評価データ セットを提案しました。この作品はXプラットフォーム上でMPIボスのマイケル・ブラック氏やCVPRの公式アカウント、南カリフォルニア大学コンピュータサイエンス学部の公式アカウントなどから賞賛された。以下は論文「Amodal Ground Truth and Completion in the Wild」の主な内容です。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。


  • #紙のリンク: https://arxiv.org/pdf/2312.17247.pdf
  • #プロジェクトのホームページ: https://www.robots.ox.ac.uk/~vgg/research/amodal/
  • コード アドレス: https://github.com/Championchess/Amodal-Completion-in-the-Wild
Amodal Segmentation は、遮蔽されたパーツ、つまり、オブジェクトの可視部分と不可視部分を与えるシェイプ マスク。このタスクは、オブジェクト認識、ターゲット検出、インスタンス セグメンテーション、画像編集、3D 再構成、ビデオ オブジェクト セグメンテーション、オブジェクト間の関係推論のサポート、ロボットの操作とナビゲーションなど、多くの下流タスクに利益をもたらします。これらのタスクでは、遮蔽されたオブジェクトがそのままの形状が役に立ちます。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

ただし、現実世界で非モーダル セグメンテーションのモデルのパフォーマンスを評価する方法は難しい問題です。遮蔽されたオブジェクトの数はわかりますが、これらのオブジェクトの完全な形状の参照標準または非モーダル マスクを取得するにはどうすればよいでしょうか?これまでの作業では、非モーダルマスクに対する手動のアノテーションが行われていましたが、そのようなアノテーションの参照標準では人的エラーの導入を避けるのが難しく、また、完全なオブジェクトに別のオブジェクトを直接アタッチするなど、合成データセットを作成することによる作業もあります。遮蔽されたオブジェクトの完全な形状が得られますが、この方法で取得された画像は実際の画像シーンではありません。したがって、この研究では、3D モデル投影を通じて、複数のオブジェクト カテゴリをカバーする大規模な実画像データセット (MP3D-Amodal) を構築し、アモーダル セグメンテーションのパフォーマンスを正確に評価するためのアモーダル マスクを提供する方法を提案します。さまざまなデータ セットの比較は次のとおりです。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

具体的には、実際の写真やシーンについて、MatterPort3D データ セットを例として取り上げます。 3 次元構造化データ セットを使用すると、シーン内のすべてのオブジェクトの 3 次元形状を同時にカメラに投影して、各オブジェクトのモーダル マスク (オブジェクトが互いに遮蔽しているため、目に見える形状) を取得してから、各オブジェクトを投影できます。シーン内では、オブジェクトの 3 次元形状がそれぞれカメラに投影され、オブジェクトのノンモーダル マスク、つまり完全な形状が取得されます。モーダルマスクとノンモーダルマスクを比較することで、遮蔽されたオブジェクトを抽出することができます。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。#データセットの統計は次のとおりです:

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。データセットのサンプルは以下のとおりです。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。#また、問題を解決するために、著者が抽出した任意のオブジェクトの完全な形状再構成タスク 安定拡散モデルの特徴からオブジェクトの完全な形状に関する事前知識を抽出し、遮蔽されたオブジェクトの非モーダル セグメンテーションを実行します 具体的なアーキテクチャは次のとおりです (SDAmodal) ):

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

安定拡散機能を使用する動機は、安定拡散には画像を完成させる機能があるため、オブジェクトに関するすべての情報がある程度含まれる可能性があるためです。安定した拡散 多数の画像を使用してトレーニングした後、その機能があらゆる環境のあらゆるオブジェクトを処理する能力を持つことが期待できます。以前の 2 段階のフレームワークとは異なり、SDAmodal は入力としてマークされたオクルージョン マスクを必要としません。SDAmodal は単純な構造を持っていますが、強力なゼロサンプル汎化能力を示します (次の表の設定 F と H を比較してください。COCOA のトレーニングでのみ改善できます)異なるドメインおよび異なるカテゴリの別のデータセット上で); 遮蔽されたオブジェクトの注釈がない場合でも、SDAmodal は、複数のタイプの遮蔽されたオブジェクトをカバーする既存のデータセット COCOA と、新しく提案された MP3D-Amodal データセットを改善できます。 SOTA性能(設定H)を達成しました。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

定量的な実験に加えて、定性的な比較にも SDAmodal モデルの利点が反映されています。以下の図からわかります (すべてのモデルはCOCOA トレーニングのみ)、COCOA または別の MP3D-Amodal のいずれからのものでも、さまざまなタイプのオクルージョンされたオブジェクトに対して、SDAmodal は非モーダル セグメンテーションの効果を大幅に向上させることができ、予測された非モーダル マスクは現実に近づきます。

「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。

詳細については、原論文をお読みください。

以上が「AI Perspective Eye」でマー賞を 3 回受賞したアンドリューは、あらゆるオブジェクトのオクルージョンと完成の問題を解決するチームを率いています。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

vue.jsのストリングをオブジェクトに変換するためにどのような方法が使用されますか? vue.jsのストリングをオブジェクトに変換するためにどのような方法が使用されますか? Apr 07, 2025 pm 09:39 PM

vue.jsのオブジェクトに文字列を変換する場合、標準のjson文字列にはjson.parse()が推奨されます。非標準のJSON文字列の場合、文字列は正規表現を使用して処理し、フォーマットまたはデコードされたURLエンコードに従ってメソッドを削減できます。文字列形式に従って適切な方法を選択し、バグを避けるためにセキュリティとエンコードの問題に注意してください。

VUEでエクスポートデフォルトによってエクスポートされたコンポーネントを登録する方法 VUEでエクスポートデフォルトによってエクスポートされたコンポーネントを登録する方法 Apr 07, 2025 pm 06:24 PM

質問:エクスポートデフォルトを通じてエクスポートされるVUEコンポーネントを登録する方法は?回答:3つの登録方法があります。グローバル登録:vue.component()メソッドを使用して、グローバルコンポーネントとして登録します。ローカル登録:現在のコンポーネントとそのサブコンポーネントでのみ利用可能なコンポーネントオプションに登録します。動的登録:vue.component()メソッドを使用して、コンポーネントが読み込まれた後に登録します。

MySQLインストール後にデータベースのパフォーマンスを最適化する方法 MySQLインストール後にデータベースのパフォーマンスを最適化する方法 Apr 08, 2025 am 11:36 AM

MySQLパフォーマンスの最適化は、インストール構成、インデックス作成、クエリの最適化、監視、チューニングの3つの側面から開始する必要があります。 1。インストール後、INNODB_BUFFER_POOL_SIZEパラメーターやclose query_cache_sizeなど、サーバーの構成に従ってmy.cnfファイルを調整する必要があります。 2。過度のインデックスを回避するための適切なインデックスを作成し、説明コマンドを使用して実行計画を分析するなど、クエリステートメントを最適化します。 3. MySQL独自の監視ツール(ShowProcessList、ShowStatus)を使用して、データベースの健康を監視し、定期的にデータベースをバックアップして整理します。これらの手順を継続的に最適化することによってのみ、MySQLデータベースのパフォーマンスを改善できます。

インストール後にMySQLの使用方法 インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調​​整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLを解決する方法は開始できません MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

MySQLの主な鍵はヌルにすることができます MySQLの主な鍵はヌルにすることができます Apr 08, 2025 pm 03:03 PM

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です Apr 08, 2025 pm 12:27 PM

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

See all articles