コーヒー買ってきて☕
*メモ:
-
私の投稿では、MNIST、EMNIST、QMNIST、ETLCDB、くずし字、Moving MNIST について説明しています。
-
私の投稿では、Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10、CIFAR-100 について説明しています。
-
私の投稿では、Oxford-IIIT Pet、Oxford 102 Flower、Stanford Cars、Places365、Flickr8k、および Flickr30k について説明しています。
(1) ImageNet(2009):
- には、1,331,167 個のオブジェクト画像 (トレイン用に 1,281,167 個、検証用に 50,000 個) があり、それぞれが 1,000 クラスのラベルに接続されています。
*メモ:
- 各クラスには、同じものを表す 1 つ以上の名前があります。
- ILSVRC2012_devkit_t12.tar.gz、ILSVRC2012_img_train.tar、ILSVRC2012_img_val.tar をダウンロードできます。
- は PyTorch の ImageNet() です。
(2) LSUN(大規模シーン理解)(2015):
- にはシーン画像があり、寝室、橋、屋外教会、教室、会議室の 10 個のデータセットがあります。 、ダイニングルーム、 キッチン、リビングルーム、レストラン、およびタワー:
-
寝室 には 3,033,342 枚の寝室画像があります (電車用に 3,033,042 枚、検証用に 300 枚)。
-
橋 には 818,987 枚の橋の画像があります (列車用に 818,687 枚、検証用に 300 枚)。
-
Church Outdoor には 126,527 枚の教会の屋外画像があります (電車用に 126,227 枚、検証用に 300 枚)。
-
教室 には、126,527 枚の教室画像があります (電車用に 126,227 枚、検証用に 300 枚)。
-
会議室 には、229,369 枚の会議室画像があります (電車用に 229,069 枚、検証用に 300 枚)。
-
ダイニングルーム には、657,871 枚のダイニングルームの画像があります (電車用に 657,571 枚、検証用に 300 枚)。
-
キッチン には 2,212,577 枚のキッチン画像があります (電車用に 2,212,277 枚、検証用に 300 枚)。
-
リビングルーム には、リビングルームの画像が 1,316,102 枚あります (電車用に 1,315,802 枚、検証用に 300 枚)。
-
レストランには、626,631 枚のレストラン画像があります (電車用に 626,331 枚、検証用に 300 枚)。
-
タワー には 708,564 枚のタワー画像があります (電車用に 708,264 枚、検証用に 300 枚)。
- は PyTorch の LSUN() ですが、バグがあります。
(3) MS COCO(Microsoft Common Objects in Context)(2014):
- には注釈付きのオブジェクト画像があり、2014 Train 画像 と 2014 Val 画像 と 2014 Train/Val 注釈、2014 の 16 個のデータセットがあります。 2014 テストによるテスト画像画像情報、2015 テスト画像 と 2015 テスト画像情報、2017 トレーニング画像 および 2017 ヴァル画像 と 2017 Train/Val 注釈、 2017 Stuff Train/Val 注釈 または 2017 Panoptic Train/Val 注釈、2017 テスト画像 と 2017 テスト画像情報 および 2017 ラベルのない画像 2017 ラベルなし画像情報:
*メモ:
-
2014 年の鉄道画像には 82,782 枚の画像があります。
-
2014 Val イメージ には 40,504 枚の画像があります。
-
2014 Train/Val 注釈 には、2014 Train 画像 および 2014 Val 画像 の 123,286 個の注釈 (列車用に 82,782 個、検証用に 40,504 個) があります。
-
2014 テスト画像 には 40,775 枚の画像があります。
-
2014 テスト画像情報 には、2014 テスト画像 の 40,775 件の注釈があります。
-
2015 テスト画像 には 81,434 枚の画像があります。
-
2015 テスト画像情報 には、2015 テスト画像 の 81,434 件の注釈があります。
-
2017 鉄道画像には 118,287 枚の画像があります。
-
2017 Val イメージ には 5,000 枚の画像があります。
-
2017 Train/Val 注釈 には、2017 Train 画像 および 2017 Val 画像 の 123,287 個の注釈 (列車用に 118,287 個、検証用に 5,000 個) があります。
-
2017 Stuff Train/Val 注釈 には、2017 Train 画像 および 2017 Val 画像 の 123,287 個の注釈 (列車用に 118,287 個、検証用に 5,000 個) があります。
-
2017 Panoptic Train/Val 注釈 には、2017 列車画像 および 2017 Val 画像 の 123,287 個の注釈 (列車用に 118,287 個、検証用に 5,000 個) があります。
-
2017 テスト画像には 40,670 枚の画像があります。
-
2017 テスト画像情報 には、2017 テスト画像 の 40,670 件の注釈があります。
-
2017 ラベルなし画像 には 123,403 枚の画像があります。
-
2017 ラベルなし画像情報 には、2017 ラベルなし画像 に関する 123,403 件の注釈があります。
- は単に COCO とも呼ばれます。
- は CocoDetection() または CocoCaptions() です
以上がコンピュータービジョン用のデータセット (4)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。