ホームページ > バックエンド開発 > Python チュートリアル > コンピュータービジョン用のデータセット (4)

コンピュータービジョン用のデータセット (4)

Barbara Streisand
リリース: 2024-12-09 19:43:17
オリジナル
289 人が閲覧しました

コーヒー買ってきて☕

*メモ:

  • 私の投稿では、MNIST、EMNIST、QMNIST、ETLCDB、くずし字、Moving MNIST について説明しています。
  • 私の投稿では、Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10、CIFAR-100 について説明しています。
  • 私の投稿では、Oxford-IIIT Pet、Oxford 102 Flower、Stanford Cars、Places365、Flickr8k、および Flickr30k について説明しています。

(1) ImageNet(2009):

  • には、1,331,167 個のオブジェクト画像 (トレイン用に 1,281,167 個、検証用に 50,000 個) があり、それぞれが 1,000 クラスのラベルに接続されています。 *メモ:
    • 各クラスには、同じものを表す 1 つ以上の名前があります。
    • ILSVRC2012_devkit_t12.tar.gz、ILSVRC2012_img_train.tar、ILSVRC2012_img_val.tar をダウンロードできます。
  • は PyTorch の ImageNet() です。

Datasets for Computer Vision (4)

(2) LSUN(大規模シーン理解)(2015):

  • にはシーン画像があり、寝室屋外教会教室会議室の 10 個のデータセットがあります。 ダイニングルームキッチンリビングルームレストラン、およびタワー:
    • 寝室 には 3,033,342 枚の寝室画像があります (電車用に 3,033,042 枚、検証用に 300 枚)。
    • には 818,987 枚の橋の画像があります (列車用に 818,687 枚、検証用に 300 枚)。
    • Church Outdoor には 126,527 枚の教会の屋外画像があります (電車用に 126,227 枚、検証用に 300 枚)。
    • 教室 には、126,527 枚の教室画像があります (電車用に 126,227 枚、検証用に 300 枚)。
    • 会議室 には、229,369 枚の会議室画像があります (電車用に 229,069 枚、検証用に 300 枚)。
    • ダイニングルーム には、657,871 枚のダイニングルームの画像があります (電車用に 657,571 枚、検証用に 300 枚)。
    • キッチン には 2,212,577 枚のキッチン画像があります (電車用に 2,212,277 枚、検証用に 300 枚)。
    • リビングルーム には、リビングルームの画像が 1,316,102 枚あります (電車用に 1,315,802 枚、検証用に 300 枚)。
    • レストランには、626,631 枚のレストラン画像があります (電車用に 626,331 枚、検証用に 300 枚)。
    • タワー には 708,564 枚のタワー画像があります (電車用に 708,264 枚、検証用に 300 枚)。
  • は PyTorch の LSUN() ですが、バグがあります。

Datasets for Computer Vision (4)

(3) MS COCO(Microsoft Common Objects in Context)(2014):

  • には注釈付きのオブジェクト画像があり、2014 Train 画像2014 Val 画像2014 Train/Val 注釈2014 の 16 個のデータセットがあります。 2014 テストによるテスト画像画像情報2015 テスト画像2015 テスト画像情報2017 トレーニング画像 および 2017 ヴァル画像 2017 Train/Val 注釈2017 Stuff Train/Val 注釈 または 2017 Panoptic Train/Val 注釈2017 テスト画像2017 テスト画像情報 および 2017 ラベルのない画像 2017 ラベルなし画像情報: *メモ:
    • 2014 年の鉄道画像には 82,782 枚の画像があります。
    • 2014 Val イメージ には 40,504 枚の画像があります。
    • 2014 Train/Val 注釈 には、2014 Train 画像 および 2014 Val 画像 の 123,286 個の注釈 (列車用に 82,782 個、検証用に 40,504 個) があります。
    • 2014 テスト画像 には 40,775 枚の画像があります。
    • 2014 テスト画像情報 には、2014 テスト画像 の 40,775 件の注釈があります。
    • 2015 テスト画像 には 81,434 枚の画像があります。
    • 2015 テスト画像情報 には、2015 テスト画像 の 81,434 件の注釈があります。
    • 2017 鉄道画像には 118,287 枚の画像があります。
    • 2017 Val イメージ には 5,000 枚の画像があります。
    • 2017 Train/Val 注釈 には、2017 Train 画像 および 2017 Val 画像 の 123,287 個の注釈 (列車用に 118,287 個、検証用に 5,000 個) があります。
    • 2017 Stuff Train/Val 注釈 には、2017 Train 画像 および 2017 Val 画像 の 123,287 個の注釈 (列車用に 118,287 個、検証用に 5,000 個) があります。
    • 2017 Panoptic Train/Val 注釈 には、2017 列車画像 および 2017 Val 画像 の 123,287 個の注釈 (列車用に 118,287 個、検証用に 5,000 個) があります。
    • 2017 テスト画像には 40,670 枚の画像があります。
    • 2017 テスト画像情報 には、2017 テスト画像 の 40,670 件の注釈があります。
    • 2017 ラベルなし画像 には 123,403 枚の画像があります。
    • 2017 ラベルなし画像情報 には、2017 ラベルなし画像 に関する 123,403 件の注釈があります。
  • は単に COCO とも呼ばれます。
  • は CocoDetection() または CocoCaptions() です

Datasets for Computer Vision (4)

以上がコンピュータービジョン用のデータセット (4)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:dev.to
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート