Kauf mir einen Kaffee☕
*Memos:
-
Mein Beitrag erklärt MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST.
-
Mein Beitrag erklärt Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 und CIFAR-100.
(1) Oxford-IIIT Haustier (2012):
- hat die 7.349 Katzen- und Hundebilder, die jeweils mit dem Label aus 37 Klassen verbunden sind:
*Memos:
- Jede Klasse hat ungefähr 200 Bilder.
- 3.680 für Zug oder Zug und Validierung und 3.669 für Test.
- ist OxfordIIITPet() in PyTorch.
(2) Oxford 102 Flower(2008):
- hat 8.189 Blumenbilder (1.020 für den Zug, 1.020 für die Validierung und 6.149 für den Test) mit den 102 Kategorien (Klassen). *Jede Klasse hat 40 bis 258 Bilder.
- ist Flowers102() in PyTorch.
(3) Stanford Cars (2013):
- hat 16185 Autobilder (8.144 für den Zug und 8.041 für den Test) mit 196 Klassen.
- ist StanfordCars() in PyTorch.
(4) Places365(2017):
- hat Szenenbilder mit den 365 Szenenkategorien (Klassen) aus den 434 Szenenkategorien (Klassen) in der Ortsdatenbank und es gibt Places365-Standard, Places365-Challenge und Places-Extra69 wie Sie hier sehen können:
*Memos:
-
Places365-Standard verfügt über 2.168.460 Bilder (1.803.460 für den Zug, 36.500 für die Validierung und 328.500 für den Test) mit den 365 Kategorien (Klassen) der 434 Kategorien (Klassen) in der Places-Datenbank. *Es gibt 50 Bilder pro Kategorie (Klasse) im Validierungssatz und 900 Bilder pro Kategorie (Klasse) im Testsatz.
-
Places365-Challenge verfügt über 8.391.628 Bilder (8.026.628 für den Zug, 36.500 für die Validierung und 328.500 für den Test), wodurch 6.223.168 zusätzliche Bilder zum Zugsatz von Places365-Standard hinzugefügt werden.
-
Places-Extra69 verfügt über 105.321 Bilder (98.721 für den Zug und 6.600 für den Test) mit den zusätzlichen 69 Kategorien (Klassen) aus den 434 Kategorien (Klassen) in der Places-Datenbank. *Derzeit kann es nicht heruntergeladen werden.
- ist Places365() in PyTorch.
(5) Flickr8k (2013):
- hat die 8.091 von Flickr erhaltenen Bilder mit den fünf verschiedenen Bildunterschriften für jedes Bild.
- ist Flickr8k() in PyTorch, aber es erklärt nicht, wie man den Datensatz dafür einrichtet, sodass ich nicht weiß, wie ich den Datensatz damit laden soll.
(6) Flickr30k(2015):
- hat 31.784 Bilder von Flickr mit den fünf verschiedenen Bildunterschriften für jedes Bild.
- ist Flickr8k() in PyTorch, aber es erklärt nicht, wie man den Datensatz dafür einrichtet, sodass ich nicht weiß, wie ich den Datensatz damit laden soll.
Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (3). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!