Maison > développement back-end > Tutoriel Python > Ensembles de données pour la vision par ordinateur (3)

Ensembles de données pour la vision par ordinateur (3)

Linda Hamilton
Libérer: 2024-12-03 10:00:24
original
429 Les gens l'ont consulté

Achetez-moi un café☕

*Mémos :

  • Mon article explique MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji et Moving MNIST.
  • Mon article explique Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 et CIFAR-100.

(1) Oxford-IIIT Pet (2012) :

  • a les 7 349 images de chats et de chiens chacune connectées au label provenant de 37 classes : *Mémos :
    • Chaque classe contient environ 200 images.
    • 3 680 pour train ou train et validation et 3 669 pour test.
  • est OxfordIIITPet() dans PyTorch.

Datasets for Computer Vision (3)

(2) Oxford 102 Fleur(2008) :

  • comprend 8 189 images de fleurs (1 020 pour le train, 1 020 pour la validation et 6 149 pour le test) avec les 102 catégories (classes). *Chaque classe contient de 40 à 258 images.
  • est Flowers102() dans PyTorch.

Datasets for Computer Vision (3)

(3) Voitures Stanford (2013) :

  • a 16 185 images de voitures (8 144 pour le train et 8 041 pour le test) avec 196 classes.
  • est StanfordCars() dans PyTorch.

Datasets for Computer Vision (3)

(4) Places365(2017) :

  • a des images de scène avec les 365 catégories (classes) de scène sur les 434 catégories (classes) de scène dans la base de données Places et il y a Places365-Standard, Places365-Challenge et Places-Extra69 comme vous pouvez le voir ici : *Mémos :
    • Places365-Standard compte 2 168 460 images (1 803 460 pour le train, 36 500 pour la validation et 328 500 pour le test) avec les 365 catégories sur les 434 catégories de la base de données Places. *Il y a 50 images par catégorie (classe) dans l'ensemble de validation et 900 images par catégorie (classe) dans l'ensemble de test.
    • Places365-Challenge compte 8 391 628 images (8 026 628 pour le train, 36 500 pour la validation et 328 500 pour le test), ajoutant 6 223 168 images supplémentaires à la rame de Places365-Standard.
    • Places-Extra69 contient 105 321 images (98 721 pour le train et 6 600 pour le test) avec les 69 catégories (classes) supplémentaires sur les 434 catégories (classes) de la base de données Places. *Actuellement, il ne peut pas être téléchargé.
  • est Places365() dans PyTorch.

Datasets for Computer Vision (3)

(5) Flickr8k(2013) :

  • contient les 8 091 images obtenues à partir de Flickr avec les cinq légendes différentes pour chaque image.
  • est Flickr8k() dans PyTorch mais il n'explique pas comment configurer l'ensemble de données, donc je ne sais pas comment charger l'ensemble de données avec.

Datasets for Computer Vision (3)

(6) Flickr30k(2015) :

  • comprend 31 784 images obtenues à partir de Flickr avec les cinq légendes différentes pour chaque image.
  • est Flickr8k() dans PyTorch mais il n'explique pas comment configurer l'ensemble de données, donc je ne sais pas comment charger l'ensemble de données avec.

Datasets for Computer Vision (3)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:dev.to
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal