커피 한잔 사주세요😄
*메모:
-
내 게시물에서는 MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji 및 Moving MNIST에 대해 설명합니다.
-
내 게시물에서는 Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 및 CIFAR-100에 대해 설명합니다.
-
내 게시물에서는 Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k 및 Flickr30k에 대해 설명합니다.
-
내 게시물에서는 ImageNet, LSUN 및 MS COCO에 대해 설명합니다.
-
내 게시물에서는 이미지 분류(인식), 개체 위치 파악, 개체 감지 및 이미지 분할에 대해 설명합니다.
-
내 게시물에서는 키포인트 감지(랜드마크 감지), 이미지 매칭, 객체 추적, 스테레오 매칭, 비디오 예측, 광학 흐름, 이미지 캡션에 대해 설명합니다.
(1) PASCAL VOC(패턴 분석, 통계 모델링 및 전산 학습 시각적 객체 클래스)(2005):
- 객체 이미지와 4개, 10개 또는 20개 클래스의 주석이 있고 8개의 데이터 세트 VOC2005, VOC2006, VOC2007, VOC2008, VOC2009, VOC2010, VOC2011 및 VOC2012:
*메모:
VOC2005에는 4개 클래스로 구성된 2,232개의 이미지와 주석(일부는 훈련용, 일부는 검증용, 일부는 테스트용)이 있습니다.-
VOC2006에는 10개 클래스로 구성된 5,304개의 이미지와 주석(기차용 1,277개, 검증용 1,341개, 테스트용 2,686개)이 있습니다.-
VOC2007에는 9,963개의 이미지와 주석(트레인용 2,501개, 검증용 2,510개, 테스트용 4,952개)과 20개의 클래스가 있습니다.-
VOC2008에는 20개의 클래스가 포함된 5,096개의 이미지와 주석(트레인용 2,111개, 검증용 2,221개, 추가 764개)이 있습니다. *테스트용 이미지가 4,133개 있으니 그냥 무시하세요.-
VOC2009에는 20개의 클래스가 포함된 7,818개의 이미지와 주석(기차용 3,473개, 검증용 3,581개, 추가 764개)이 있습니다.-
VOC2010에는 20개의 클래스가 포함된 11,321개의 이미지와 주석(트레인용 4,998개, 검증용 5,105개, 추가 1,218개)이 있습니다.-
VOC2011에는 14,961개의 이미지와 주석(트레인용 5,717개, 검증용 5,823개, 추가용 3,421개)과 20개의 클래스가 있습니다.-
VOC2012에는 20개의 클래스가 포함된 17,125개의 이미지와 주석(기차용 5,717개, 검증용 5,823개, 추가 5,585개)이 있습니다.-
PyTorch의 VOCSegmentation() 및 VOCDetection()입니다.-
(2) SUN 데이터베이스(장면 이해 데이터베이스)(2010):
397개 클래스에 108,754개의 장면 이미지가 있습니다.-
SUN397이라고도 합니다.-
PyTorch의 SUN397()입니다.-
(3) Kinetics 데이터세트(2017):
- 인간 행동 짧은 비디오 클립이 있으며 Kinetics-400, Kinetics-600 및 Kinetics-700 3개의 데이터 세트가 있습니다.
*메모:
- 각 동영상 클립의 길이는 약 10초입니다.
-
Kinetics-400(2017)에는 400개 카테고리(클래스)의 라벨에 각각 연결된 306,245개의 비디오 클립이 있습니다.
-
Kinetics-600(2018)에는 600개 카테고리의 라벨에 각각 연결된 495,547개의 비디오 클립이 있습니다.
-
Kinetics-700(2019)에는 700개 카테고리의 라벨에 각각 연결된 545,317개의 영상 클립이 있습니다.
- 동영상 분류에 사용됩니다.
- PyTorch의 Kinetics()입니다.
(4) 도시 풍경(2016):
- 30개 클래스를 8개 카테고리로 그룹화하여 의미론적 이해가 가능한 25,000개의 주석이 달린 도시 거리 풍경 이미지를 보유하고 있습니다. *5,000개의 이미지는 미세한 주석이 달린 이미지이고 20,000개의 이미지는 거친 주석이 달린 이미지입니다.
- 이미지 분할에 사용됩니다.
- 는 PyTorch의 Cityscapes()입니다. *데이터세트 설정 방법은 설명되어 있지 않습니다.
고급 주석이 달린 이미지:
대략 주석이 달린 이미지:
위 내용은 컴퓨터 비전용 데이터 세트 (5)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!