컴퓨터 비전용 데이터 세트 (5)-파이썬 튜토리얼-php.cn

컴퓨터 비전용 데이터 세트 (5)

Barbara Streisand

풀어 주다： 2024-12-26 16:42:15

원래의

562명이 탐색했습니다.

커피 한잔 사주세요😄

*메모:

내 게시물에서는 MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji 및 Moving MNIST에 대해 설명합니다.
내 게시물에서는 Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 및 CIFAR-100에 대해 설명합니다.
내 게시물에서는 Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k 및 Flickr30k에 대해 설명합니다.
내 게시물에서는 ImageNet, LSUN 및 MS COCO에 대해 설명합니다.
내 게시물에서는 이미지 분류(인식), 개체 위치 파악, 개체 감지 및 이미지 분할에 대해 설명합니다.
내 게시물에서는 키포인트 감지(랜드마크 감지), 이미지 매칭, 객체 추적, 스테레오 매칭, 비디오 예측, 광학 흐름, 이미지 캡션에 대해 설명합니다.

(1) PASCAL VOC(패턴 분석, 통계 모델링 및 전산 학습 시각적 객체 클래스)(2005):

객체 이미지와 4개, 10개 또는 20개 클래스의 주석이 있고 8개의 데이터 세트 VOC2005, VOC2006, VOC2007, VOC2008, VOC2009, VOC2010, VOC2011 및 VOC2012: *메모:

Datasets for Computer Vision (5)

(2) SUN 데이터베이스(장면 이해 데이터베이스)(2010):

Datasets for Computer Vision (5)

(3) Kinetics 데이터세트(2017):

인간 행동 짧은 비디오 클립이 있으며 Kinetics-400, Kinetics-600 및 Kinetics-700 3개의 데이터 세트가 있습니다. *메모:
- 각 동영상 클립의 길이는 약 10초입니다.
- Kinetics-400(2017)에는 400개 카테고리(클래스)의 라벨에 각각 연결된 306,245개의 비디오 클립이 있습니다.
- Kinetics-600(2018)에는 600개 카테고리의 라벨에 각각 연결된 495,547개의 비디오 클립이 있습니다.
- Kinetics-700(2019)에는 700개 카테고리의 라벨에 각각 연결된 545,317개의 영상 클립이 있습니다.
동영상 분류에 사용됩니다.
PyTorch의 Kinetics()입니다.

Datasets for Computer Vision (5)

(4) 도시 풍경(2016):

30개 클래스를 8개 카테고리로 그룹화하여 의미론적 이해가 가능한 25,000개의 주석이 달린 도시 거리 풍경 이미지를 보유하고 있습니다. *5,000개의 이미지는 미세한 주석이 달린 이미지이고 20,000개의 이미지는 거친 주석이 달린 이미지입니다.
이미지 분할에 사용됩니다.
는 PyTorch의 Cityscapes()입니다. *데이터세트 설정 방법은 설명되어 있지 않습니다.

고급 주석이 달린 이미지:

Datasets for Computer Vision (5)