请我喝杯咖啡☕
*备忘录:
-
我的帖子解释了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。
-
我的帖子解释了 Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10 和 CIFAR-100。
-
我的帖子解释了 Oxford-IIIT Pet、Oxford 102 Flower、Stanford Cars、Places365、Flickr8k 和 Flickr30k。
(1) ImageNet(2009):
- 有 1,331,167 个对象图像(1,281,167 个用于训练,50,000 个用于验证),每个图像都连接到来自 1000 个类别的标签:
*备注:
- 每个类都有一个或多个代表相同事物的名称。
- 您可以下载 ILSVRC2012_devkit_t12.tar.gz、ILSVRC2012_img_train.tar 和 ILSVRC2012_img_val.tar。
- 是 PyTorch 中的 ImageNet()。
(2) LSUN(大规模场景理解)(2015):
- 有场景图像,有10个数据集卧室、桥梁、教堂户外、教室、会议室,餐厅, 厨房、客厅、餐厅和塔楼:
-
卧室 有 3,033,342 张卧室图像(3,033,042 张用于火车,300 张用于验证)。
-
桥梁 有 818,987 张桥梁图像(818,687 张用于火车,300 张用于验证)。
-
教堂户外有126,527张教堂户外图像(126,227张用于火车,300张用于验证)。
-
教室有126,527张教室图像(126,227张用于训练,300张用于验证)。
-
会议室有229,369张会议室图像(229,069张用于训练,300张用于验证)。
-
餐厅有 657,871 个餐厅图像(657,571 个用于火车,300 个用于验证)。
-
厨房 有 2,212,577 张厨房图像(2,212,277 张用于火车,300 张用于验证)。
-
客厅有1,316,102张客厅图像(1,315,802张用于火车,300张用于验证)。
-
餐厅有626,631张餐厅图片(626,331张用于火车,300张用于验证)。
-
塔 有 708,564 个塔图像(708,264 个用于训练,300 个用于验证)。
- 是 PyTorch 中的 LSUN(),但它有错误。
(3) MS COCO(Microsoft Common Objects in Context)(2014):
- 有带注释的对象图像,并且有 16 个数据集 2014 年训练图像 和 2014 Val 图像 以及 2014 年训练/Val 注释、2014测试图像与2014年测试图像信息、2015 测试图像 与2015 测试图像信息、2017 训练图像 和2017 Val 图像 与2017 Train/Val 注释, 2017填充训练/Val 注释 或 2017 全景训练/Val 注释、2017 测试图像 以及 2017 测试图像信息 和 2017 年未标记图像 与 2017 年未标记图像信息:
*备注:
-
2014 年火车图像 有 82,782 张图像。
-
2014 Val 图像 有 40,504 张图像。
-
2014 Train/Val 注释 对于 2014 Train 图像 和 2014 Val 图像有 123,286 个注释(82,782 个用于训练,40,504 个用于验证)。
-
2014 年测试图像 有 40,775 张图像。
-
2014 年测试图像信息 有 40,775 个关于 2014 年测试图像的注释。
-
2015 年测试图像 有 81,434 张图像。
-
2015 年测试图像信息 有 81,434 个关于 2015 年测试图像的注释。
-
2017 年火车图像 有 118,287 张图像。
-
2017 Val 图片 有 5,000 张图片。
-
2017 Train/Val 注释 有 123,287 个注释(118,287 个用于训练,5,000 个用于验证),用于 2017 Train 图像 和 2017 Val 图像。
-
2017 Stuff Train/Val 注释 有 123,287 个注释(118,287 个用于训练,5,000 个用于验证),用于 2017 Train 图像 和 2017 Val 图像。
-
2017 Panoptic Train/Val 注释 有 123,287 个注释(118,287 个用于训练,5,000 个用于验证),用于 2017 Train 图像 和 2017 Val 图像。
-
2017 年测试图像 有 40,670 张图像。
-
2017 年测试图像信息 有 40,670 个关于 2017 年测试图像的注释。
-
2017 年未标记图像 有 123,403 张图像。
-
2017 年未标记图像信息 有 123,403 个关于 2017 年未标记图像的注释。
- 也称为COCO。
- 是 CocoDetection() 或 CocoCaptions()
以上是计算机视觉数据集 (4)的详细内容。更多信息请关注PHP中文网其他相关文章!