Heim > Backend-Entwicklung > Python-Tutorial > Datensätze für Computer Vision (4)

Datensätze für Computer Vision (4)

Barbara Streisand
Freigeben: 2024-12-09 19:43:17
Original
288 Leute haben es durchsucht

Kauf mir einen Kaffee☕

*Memos:

  • In meinem Beitrag werden MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST erklärt.
  • Mein Beitrag erklärt Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 und CIFAR-100.
  • In meinem Beitrag werden Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k und Flickr30k erklärt.

(1) ImageNet(2009):

  • hat die 1.331.167 Objektbilder (1.281.167 für den Zug und 50.000 für die Validierung), die jeweils mit dem Etikett aus 1.000 Klassen verbunden sind: *Memos:
    • Jede Klasse hat einen oder mehrere Namen, die die gleichen Dinge darstellen.
    • Sie können ILSVRC2012_devkit_t12.tar.gz, ILSVRC2012_img_train.tar und ILSVRC2012_img_val.tar herunterladen.
  • ist ImageNet() in PyTorch.

Datasets for Computer Vision (4)

(2) LSUN (Large-scale Scene Understanding) (2015):

  • hat Szenenbilder und es gibt die 10 Datensätze Schlafzimmer, Brücke, Kirche im Freien, Klassenzimmer, Konferenzraum , Esszimmer, Küche, Wohnzimmer, Restaurant und Turm:
    • Schlafzimmer hat 3.033.342 Schlafzimmerbilder (3.033.042 für den Zug und 300 für die Validierung).
    • Brücke hat 818.987 Brückenbilder (818.687 für den Zug und 300 für die Validierung).
    • Church Outdoor hat 126.527 Bilder von Kirchen im Freien (126.227 für den Zug und 300 für die Validierung).
    • Klassenzimmer verfügt über 126.527 Klassenzimmerbilder (126.227 für den Zug und 300 für die Validierung).
    • Konferenzraum verfügt über 229.369 Konferenzraumbilder (229.069 für den Zug und 300 für die Validierung).
    • Esszimmer hat 657.871 Esszimmerbilder (657.571 für den Zug und 300 für die Validierung).
    • Küche hat 2.212.577 Küchenbilder (2.212.277 für den Zug und 300 für die Validierung).
    • Wohnzimmer hat 1.316.102 Wohnzimmerbilder (1.315.802 für den Zug und 300 für die Validierung).
    • Restaurant hat 626.631 Restaurantbilder (626.331 für den Zug und 300 für die Validierung).
    • Turm hat 708.564 Turmbilder (708.264 für den Zug und 300 für die Validierung).
  • ist LSUN() in PyTorch, aber es hat den Fehler.

Datasets for Computer Vision (4)

(3) MS COCO (Microsoft Common Objects in Context) (2014):

  • hat Objektbilder mit Anmerkungen und es gibt die 16 Datensätze 2014 Train-Bilder und 2014 Val-Bilder mit 2014 Train/Val-Anmerkungen, 2014 Testbilder mit 2014 Testing Image info, 2015 Testbilder mit 2015 Testing Image info, 2017 Train images und 2017 Val images mit 2017 Train/Val-Anmerkungen, 2017 Stuff Train/Val-Anmerkungen oder 2017 Panoptic Train/Val-Anmerkungen, 2017 Testbilder mit 2017 Testing Image-Info und 2017 Unbeschriftete Bilder mit Unbeschriftete Bildinformationen 2017: *Memos:
    • Zugbilder 2014 hat 82.782 Bilder.
    • Val-Bilder 2014 hat 40.504 Bilder.
    • 2014 Train/Val-Anmerkungen enthält 123.286 Anmerkungen (82.782 für den Zug und 40.504 für die Validierung) für 2014 Train-Bilder und 2014 Val-Bilder.
    • Testbilder 2014 hat 40.775 Bilder.
    • Informationen zu Testbildern 2014 enthält 40.775 Anmerkungen für Testbilder 2014.
    • Testbilder 2015 hat 81.434 Bilder.
    • Informationen zu Testbildern 2015 enthält 81.434 Anmerkungen für Testbilder 2015.
    • Zugbilder 2017 hat 118.287 Bilder.
    • Val-Bilder 2017 hat 5.000 Bilder.
    • 2017 Train/Val-Anmerkungen enthält 123.287 Anmerkungen (118.287 für den Zug und 5.000 für die Validierung) für 2017 Train-Bilder und 2017 Val-Bilder.
    • 2017 Stuff Train/Val-Anmerkungen enthält 123.287 Anmerkungen (118.287 für den Zug und 5.000 für die Validierung) für 2017 Train-Bilder und 2017 Val-Bilder.
    • 2017 Panoptic Train/Val-Anmerkungen enthält 123.287 Anmerkungen (118.287 für den Zug und 5.000 für die Validierung) für 2017 Train-Bilder und 2017 Val-Bilder.
    • Testbilder 2017 hat 40.670 Bilder.
    • Info zu Testbildern 2017 enthält 40.670 Anmerkungen für Testbilder 2017.
    • Unbeschriftete Bilder 2017 hat 123.403 Bilder.
    • Info zu unbeschrifteten Bildern 2017 enthält 123.403 Anmerkungen für unbeschriftete Bilder 2017.
  • wird auch einfach COCO genannt.
  • ist CocoDetection() oder CocoCaptions()

Datasets for Computer Vision (4)

Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (4). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:dev.to
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage