Kauf mir einen Kaffee☕
*Memos:
-
In meinem Beitrag werden MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST erklärt.
-
Mein Beitrag erklärt Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 und CIFAR-100.
-
In meinem Beitrag werden Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k und Flickr30k erklärt.
(1) ImageNet(2009):
- hat die 1.331.167 Objektbilder (1.281.167 für den Zug und 50.000 für die Validierung), die jeweils mit dem Etikett aus 1.000 Klassen verbunden sind:
*Memos:
- Jede Klasse hat einen oder mehrere Namen, die die gleichen Dinge darstellen.
- Sie können ILSVRC2012_devkit_t12.tar.gz, ILSVRC2012_img_train.tar und ILSVRC2012_img_val.tar herunterladen.
- ist ImageNet() in PyTorch.
(2) LSUN (Large-scale Scene Understanding) (2015):
- hat Szenenbilder und es gibt die 10 Datensätze Schlafzimmer, Brücke, Kirche im Freien, Klassenzimmer, Konferenzraum , Esszimmer, Küche, Wohnzimmer, Restaurant und Turm:
-
Schlafzimmer hat 3.033.342 Schlafzimmerbilder (3.033.042 für den Zug und 300 für die Validierung).
-
Brücke hat 818.987 Brückenbilder (818.687 für den Zug und 300 für die Validierung).
-
Church Outdoor hat 126.527 Bilder von Kirchen im Freien (126.227 für den Zug und 300 für die Validierung).
-
Klassenzimmer verfügt über 126.527 Klassenzimmerbilder (126.227 für den Zug und 300 für die Validierung).
-
Konferenzraum verfügt über 229.369 Konferenzraumbilder (229.069 für den Zug und 300 für die Validierung).
-
Esszimmer hat 657.871 Esszimmerbilder (657.571 für den Zug und 300 für die Validierung).
-
Küche hat 2.212.577 Küchenbilder (2.212.277 für den Zug und 300 für die Validierung).
-
Wohnzimmer hat 1.316.102 Wohnzimmerbilder (1.315.802 für den Zug und 300 für die Validierung).
-
Restaurant hat 626.631 Restaurantbilder (626.331 für den Zug und 300 für die Validierung).
-
Turm hat 708.564 Turmbilder (708.264 für den Zug und 300 für die Validierung).
- ist LSUN() in PyTorch, aber es hat den Fehler.
(3) MS COCO (Microsoft Common Objects in Context) (2014):
- hat Objektbilder mit Anmerkungen und es gibt die 16 Datensätze 2014 Train-Bilder und 2014 Val-Bilder mit 2014 Train/Val-Anmerkungen, 2014 Testbilder mit 2014 Testing Image info, 2015 Testbilder mit 2015 Testing Image info, 2017 Train images und 2017 Val images mit 2017 Train/Val-Anmerkungen, 2017 Stuff Train/Val-Anmerkungen oder 2017 Panoptic Train/Val-Anmerkungen, 2017 Testbilder mit 2017 Testing Image-Info und 2017 Unbeschriftete Bilder mit Unbeschriftete Bildinformationen 2017:
*Memos:
-
Zugbilder 2014 hat 82.782 Bilder.
-
Val-Bilder 2014 hat 40.504 Bilder.
-
2014 Train/Val-Anmerkungen enthält 123.286 Anmerkungen (82.782 für den Zug und 40.504 für die Validierung) für 2014 Train-Bilder und 2014 Val-Bilder.
-
Testbilder 2014 hat 40.775 Bilder.
-
Informationen zu Testbildern 2014 enthält 40.775 Anmerkungen für Testbilder 2014.
-
Testbilder 2015 hat 81.434 Bilder.
-
Informationen zu Testbildern 2015 enthält 81.434 Anmerkungen für Testbilder 2015.
-
Zugbilder 2017 hat 118.287 Bilder.
-
Val-Bilder 2017 hat 5.000 Bilder.
-
2017 Train/Val-Anmerkungen enthält 123.287 Anmerkungen (118.287 für den Zug und 5.000 für die Validierung) für 2017 Train-Bilder und 2017 Val-Bilder.
-
2017 Stuff Train/Val-Anmerkungen enthält 123.287 Anmerkungen (118.287 für den Zug und 5.000 für die Validierung) für 2017 Train-Bilder und 2017 Val-Bilder.
-
2017 Panoptic Train/Val-Anmerkungen enthält 123.287 Anmerkungen (118.287 für den Zug und 5.000 für die Validierung) für 2017 Train-Bilder und 2017 Val-Bilder.
-
Testbilder 2017 hat 40.670 Bilder.
-
Info zu Testbildern 2017 enthält 40.670 Anmerkungen für Testbilder 2017.
-
Unbeschriftete Bilder 2017 hat 123.403 Bilder.
-
Info zu unbeschrifteten Bildern 2017 enthält 123.403 Anmerkungen für unbeschriftete Bilder 2017.
- wird auch einfach COCO genannt.
- ist CocoDetection() oder CocoCaptions()
Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (4). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!