Ensembles de données pour la vision par ordinateur (5)-Tutoriel Python-php.cn

Ensembles de données pour la vision par ordinateur (5)

Barbara Streisand

Libérer： 2024-12-26 16:42:15

original

563 Les gens l'ont consulté

Achetez-moi un café☕

*Mémos :

Mon article explique MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji et Moving MNIST.
Mon article explique Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 et CIFAR-100.
Mon article explique Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k et Flickr30k.
Mon article explique ImageNet, LSUN et MS COCO.
Mon article explique la classification des images (reconnaissance), la localisation d'objets, la détection d'objets et la segmentation d'images.
Mon article explique la détection de points clés (détection de points de repère), la correspondance d'images, le suivi d'objets, la correspondance stéréo, la prédiction vidéo, le flux optique, le sous-titrage d'images.

(1) PASCAL VOC (Analyse de modèles, modélisation statistique et classes d'objets visuels d'apprentissage informatique) (2005) :

Datasets for Computer Vision (5)

(2) Base de données SUN (base de données Scene UNderstanding)(2010) :

Datasets for Computer Vision (5)

(3) Ensemble de données cinétiques (2017) :

a de courts clips vidéo sur l'action humaine et il y a les 3 ensembles de données Kinetics-400, Kinetics-600 et Kinetics-700 : *Mémos :
- Chaque clip vidéo dure environ 10 secondes.
- Kinetics-400 (2017) compte 306 245 clips vidéo chacun connectés au label provenant de 400 catégories (classes).
- Kinetics-600 (2018) compte 495 547 clips vidéo chacun connectés au label parmi 600 catégories.
- Kinetics-700 (2019) compte 545 317 clips vidéo chacun connectés au label parmi 700 catégories.
est utilisé pour la classification vidéo.
est Kinetics() dans PyTorch.

Datasets for Computer Vision (5)

(4) Paysages urbains (2016) :

contient les 25 000 images annotées de scènes de rue urbaines de compréhension sémantique avec les 30 classes regroupées en 8 catégories. *5 000 images sont annotées finement et 20 000 images sont annotées grossièrement.
est utilisé pour la segmentation d'images.
est Cityscapes() dans PyTorch. *Comment définir l'ensemble de données n'est pas expliqué.

Images finement annotées :

Datasets for Computer Vision (5)