> 백엔드 개발 > 파이썬 튜토리얼 > 컴퓨터 비전용 데이터 세트 (5)

컴퓨터 비전용 데이터 세트 (5)

Barbara Streisand
풀어 주다: 2024-12-26 16:42:15
원래의
463명이 탐색했습니다.

커피 한잔 사주세요😄

*메모:

  • 내 게시물에서는 MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji 및 Moving MNIST에 대해 설명합니다.
  • 내 게시물에서는 Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 및 CIFAR-100에 대해 설명합니다.
  • 내 게시물에서는 Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k 및 Flickr30k에 대해 설명합니다.
  • 내 게시물에서는 ImageNet, LSUN 및 MS COCO에 대해 설명합니다.
  • 내 게시물에서는 이미지 분류(인식), 개체 위치 파악, 개체 감지 및 이미지 분할에 대해 설명합니다.
  • 내 게시물에서는 키포인트 감지(랜드마크 감지), 이미지 매칭, 객체 추적, 스테레오 매칭, 비디오 예측, 광학 흐름, 이미지 캡션에 대해 설명합니다.

(1) PASCAL VOC(패턴 분석, 통계 모델링 및 전산 학습 시각적 객체 클래스)(2005):

  • 객체 이미지와 4개, 10개 또는 20개 클래스의 주석이 있고 8개의 데이터 세트 VOC2005, VOC2006, VOC2007, VOC2008, VOC2009, VOC2010, VOC2011VOC2012: *메모:
      VOC2005에는 4개 클래스로 구성된 2,232개의 이미지와 주석(일부는 훈련용, 일부는 검증용, 일부는 테스트용)이 있습니다.
    • VOC2006에는 10개 클래스로 구성된 5,304개의 이미지와 주석(기차용 1,277개, 검증용 1,341개, 테스트용 2,686개)이 있습니다.
    • VOC2007에는 9,963개의 이미지와 주석(트레인용 2,501개, 검증용 2,510개, 테스트용 4,952개)과 20개의 클래스가 있습니다.
    • VOC2008에는 20개의 클래스가 포함된 5,096개의 이미지와 주석(트레인용 2,111개, 검증용 2,221개, 추가 764개)이 있습니다. *테스트용 이미지가 4,133개 있으니 그냥 무시하세요.
    • VOC2009에는 20개의 클래스가 포함된 7,818개의 이미지와 주석(기차용 3,473개, 검증용 3,581개, 추가 764개)이 있습니다.
    • VOC2010에는 20개의 클래스가 포함된 11,321개의 이미지와 주석(트레인용 4,998개, 검증용 5,105개, 추가 1,218개)이 있습니다.
    • VOC2011에는 14,961개의 이미지와 주석(트레인용 5,717개, 검증용 5,823개, 추가용 3,421개)과 20개의 클래스가 있습니다.
    • VOC2012에는 20개의 클래스가 포함된 17,125개의 이미지와 주석(기차용 5,717개, 검증용 5,823개, 추가 5,585개)이 있습니다.
  • PyTorch의 VOCSegmentation() 및 VOCDetection()입니다.

Datasets for Computer Vision (5)

(2) SUN 데이터베이스(장면 이해 데이터베이스)(2010):

    397개 클래스에 108,754개의 장면 이미지가 있습니다.
  • SUN397이라고도 합니다.
  • PyTorch의 SUN397()입니다.

Datasets for Computer Vision (5)

(3) Kinetics 데이터세트(2017):

  • 인간 행동 짧은 비디오 클립이 있으며 Kinetics-400, Kinetics-600Kinetics-700 3개의 데이터 세트가 있습니다. *메모:
    • 각 동영상 클립의 길이는 약 10초입니다.
    • Kinetics-400(2017)에는 400개 카테고리(클래스)의 라벨에 각각 연결된 306,245개의 비디오 클립이 있습니다.
    • Kinetics-600(2018)에는 600개 카테고리의 라벨에 각각 연결된 495,547개의 비디오 클립이 있습니다.
    • Kinetics-700(2019)에는 700개 카테고리의 라벨에 각각 연결된 545,317개의 영상 클립이 있습니다.
  • 동영상 분류에 사용됩니다.
  • PyTorch의 Kinetics()입니다.

Datasets for Computer Vision (5)

(4) 도시 풍경(2016):

  • 30개 클래스를 8개 카테고리로 그룹화하여 의미론적 이해가 가능한 25,000개의 주석이 달린 도시 거리 풍경 이미지를 보유하고 있습니다. *5,000개의 이미지는 미세한 주석이 달린 이미지이고 20,000개의 이미지는 거친 주석이 달린 이미지입니다.
  • 이미지 분할에 사용됩니다.
  • 는 PyTorch의 Cityscapes()입니다. *데이터세트 설정 방법은 설명되어 있지 않습니다.

고급 주석이 달린 이미지:

Datasets for Computer Vision (5)

대략 주석이 달린 이미지:

Datasets for Computer Vision (5)

위 내용은 컴퓨터 비전용 데이터 세트 (5)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿