首页 > 后端开发 > Python教程 > 计算机视觉数据集 (4)

计算机视觉数据集 (4)

Barbara Streisand
发布: 2024-12-09 19:43:17
原创
339 人浏览过

请我喝杯咖啡☕

*备忘录:

  • 我的帖子解释了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。
  • 我的帖子解释了 Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10 和 CIFAR-100。
  • 我的帖子解释了 Oxford-IIIT Pet、Oxford 102 Flower、Stanford Cars、Places365、Flickr8k 和 Flickr30k。

(1) ImageNet(2009):

  • 有 1,331,167 个对象图像(1,281,167 个用于训练,50,000 个用于验证),每个图像都连接到来自 1000 个类别的标签: *备注:
    • 每个类都有一个或多个代表相同事物的名称。
    • 您可以下载 ILSVRC2012_devkit_t12.tar.gz、ILSVRC2012_img_train.tar 和 ILSVRC2012_img_val.tar。
  • 是 PyTorch 中的 ImageNet()。

Datasets for Computer Vision (4)

(2) LSUN(大规模场景理解)(2015):

  • 有场景图像,有10个数据集卧室桥梁教堂户外教室会议室餐厅厨房客厅餐厅塔楼
    • 卧室 有 3,033,342 张卧室图像(3,033,042 张用于火车,300 张用于验证)。
    • 桥梁 有 818,987 张桥梁图像(818,687 张用于火车,300 张用于验证)。
    • 教堂户外有126,527张教堂户外图像(126,227张用于火车,300张用于验证)。
    • 教室有126,527张教室图像(126,227张用于训练,300张用于验证)。
    • 会议室有229,369张会议室图像(229,069张用于训练,300张用于验证)。
    • 餐厅有 657,871 个餐厅图像(657,571 个用于火车,300 个用于验证)。
    • 厨房 有 2,212,577 张厨房图像(2,212,277 张用于火车,300 张用于验证)。
    • 客厅有1,316,102张客厅图像(1,315,802张用于火车,300张用于验证)。
    • 餐厅有626,631张餐厅图片(626,331张用于火车,300张用于验证)。
    • 有 708,564 个塔图像(708,264 个用于训练,300 个用于验证)。
  • 是 PyTorch 中的 LSUN(),但它有错误。

Datasets for Computer Vision (4)

(3) MS COCO(Microsoft Common Objects in Context)(2014):

  • 有带注释的对象图像,并且有 16 个数据集 2014 年训练图像2014 Val 图像 以及 2014 年训练/Val 注释2014测试图像2014年测试图像信息2015 测试图像2015 测试图像信息2017 训练图像2017 Val 图像2017 Train/Val 注释, 2017填充训练/Val 注释2017 全景训练/Val 注释2017 测试图像 以及 2017 测试图像信息2017 年未标记图像2017 年未标记图像信息: *备注:
    • 2014 年火车图像 有 82,782 张图像。
    • 2014 Val 图像 有 40,504 张图像。
    • 2014 Train/Val 注释 对于 2014 Train 图像2014 Val 图像有 123,286 个注释(82,782 个用于训练,40,504 个用于验证)。
    • 2014 年测试图像 有 40,775 张图像。
    • 2014 年测试图像信息 有 40,775 个关于 2014 年测试图像的注释。
    • 2015 年测试图像 有 81,434 张图像。
    • 2015 年测试图像信息 有 81,434 个关于 2015 年测试图像的注释。
    • 2017 年火车图像 有 118,287 张图像。
    • 2017 Val 图片 有 5,000 张图片。
    • 2017 Train/Val 注释 有 123,287 个注释(118,287 个用于训练,5,000 个用于验证),用于 2017 Train 图像2017 Val 图像
    • 2017 Stuff Train/Val 注释 有 123,287 个注释(118,287 个用于训练,5,000 个用于验证),用于 2017 Train 图像2017 Val 图像
    • 2017 Panoptic Train/Val 注释 有 123,287 个注释(118,287 个用于训练,5,000 个用于验证),用于 2017 Train 图像2017 Val 图像
    • 2017 年测试图像 有 40,670 张图像。
    • 2017 年测试图像信息 有 40,670 个关于 2017 年测试图像的注释。
    • 2017 年未标记图像 有 123,403 张图像。
    • 2017 年未标记图像信息 有 123,403 个关于 2017 年未标记图像的注释。
  • 也称为COCO。
  • 是 CocoDetection() 或 CocoCaptions()

Datasets for Computer Vision (4)

以上是计算机视觉数据集 (4)的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:dev.to
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板