深層画像データセットは、深層学習およびコンピューター ビジョン タスクにおいて非常に重要なデータ タイプです。これには各ピクセルの深度情報が含まれており、シーンの再構成、物体検出、姿勢推定などのさまざまなアプリケーションに使用できます。この記事では、一般的に使用されるいくつかの深度画像データ セットを、そのソース、特性、アプリケーションなどを含めて紹介します。
1.NYU Depth V2
NYU Depth V2 データセットには、屋内シーンの深度画像と RGB 画像が含まれており、合計 1449 のシーン サンプルが含まれています。 。これらのシーンには、寝室、リビングルーム、キッチンなどのさまざまな屋内環境が含まれます。各シーンは、カメラの内部パラメータ情報と外部パラメータ情報を提供し、カメラの姿勢推定やシーン再構築などのタスクに使用できます。さらに、データ セットは、シーン内のオブジェクトの注釈情報も提供します。これは、オブジェクト検出やセマンティック セグメンテーションなどのタスクに使用できます。
2.Kinect Fusion
Kinect Fusion データセットは、次のようなタスクに適した、複数のシーンの RGB-D イメージと対応する 3D モデルを提供します。シーンの再構成、3D 姿勢推定、オブジェクト検出。さらに、このデータ セットは、Microsoft Kinect、Asus Xtion Pro Live、Primesense Carmine 1.08 などのデバイスを含む複数の深度センサーからのデータ形式もサポートしています。このデータは、研究者や開発者に、ディープラーニング、コンピュータービジョン、ロボット工学などの分野の研究開発のための豊富なリソースを提供します。
3.SUN RGB-D
SUN RGB-D には、屋内および屋外シーンの RGB-D イメージとシーン アノテーション情報が含まれています。データ セットには合計 10,335 のシーン サンプルが含まれており、そのうち 5,285 は屋内シーン、5,050 は屋外シーンです。各シーンは、カメラの固有パラメータ情報と外部パラメータ情報を提供します。これらの情報は、カメラの姿勢推定やシーンの再構成などのタスクに使用できます。さらに、このデータ セットは、オブジェクト カテゴリ、セマンティック セグメンテーション、シーン レイアウトなどを含むさまざまなシーン アノテーション情報も提供し、オブジェクト検出、セマンティック セグメンテーション、シーン理解などのタスクに使用できます。
4.ScanNet
ScanNet には、屋内シーンの RGB-D 画像とシーン アノテーション情報が含まれています。データセットには、オフィス、店舗、学校など、さまざまな屋内環境をカバーする合計 1,513 のシーン サンプルが含まれています。各シーンは、カメラの固有パラメータ情報と外部パラメータ情報を提供します。これらの情報は、カメラの姿勢推定やシーンの再構成などのタスクに使用できます。さらに、このデータ セットは、オブジェクト カテゴリ、セマンティック セグメンテーション、シーン レイアウトなどを含むさまざまなシーン アノテーション情報も提供し、オブジェクト検出、セマンティック セグメンテーション、シーン理解などのタスクに使用できます。
5.3DMatch
3DMatch には、複数の RGB-D センサーからの深度画像と 3D 点群データが含まれています。データセットには、さまざまな屋内および屋外環境をカバーする合計 1,525 のシーン サンプルが含まれています。各シーンは、カメラの固有パラメータ情報と外部パラメータ情報を提供します。これらの情報は、カメラの姿勢推定やシーンの再構成などのタスクに使用できます。さらに、このデータ セットは、点群登録や画像登録などの豊富なシーン登録情報も提供し、3D 再構成やシーン マッチングなどのタスクに使用できます。
つまり、深度画像データセットは、ディープ ラーニングとコンピューター ビジョンの分野で不可欠なデータ タイプであり、シーンの再構成、オブジェクトの検出など、さまざまなタスクに使用できます。 、ポーズ推定とセマンティックセグメンテーションなど。上記で紹介したデータ セットはすべて、一般的に使用されている深度画像データ セットです。それらのソースは本物で信頼できるものであり、特性や用途は異なります。特定のタスクのニーズに応じて、トレーニングと評価に適切なデータ セットを選択できます。
以上が深度画像データセットの概要の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。