Kauf mir einen Kaffee☕
*Memos:
-
In meinem Beitrag werden MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST erklärt.
-
Mein Beitrag erklärt Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 und CIFAR-100.
-
In meinem Beitrag werden Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k und Flickr30k erklärt.
-
In meinem Beitrag werden ImageNet, LSUN und MS COCO erklärt.
-
In meinem Beitrag werden Bildklassifizierung (Erkennung), Objektlokalisierung, Objekterkennung und Bildsegmentierung erläutert.
-
In meinem Beitrag werden Schlüsselpunkterkennung (Landmark-Erkennung), Bildabgleich, Objektverfolgung, Stereoabgleich, Videovorhersage, optischer Fluss und Bildunterschrift erläutert.
(1) PASCAL VOC (Pattern Analysis, Statistical Modelling, and Computational Learning Visual Object Classes) (2005):
- hat Objektbilder und Anmerkungen mit 4, 10 oder 20 Klassen und es gibt die 8 Datensätze VOC2005, VOC2006, VOC2007, VOC2008, VOC2009, VOC2010, VOC2011 und VOC2012:
*Memos:
-
VOC2005 verfügt über 2.232 Bilder und Anmerkungen (einige für den Zug, einige für die Validierung und einige für Tests) mit 4 Klassen.
-
VOC2006 verfügt über 5.304 Bilder und Anmerkungen (1.277 für Zug, 1.341 für Validierung und 2.686 für Test) mit 10 Klassen.
-
VOC2007 verfügt über 9.963 Bilder und Anmerkungen (2.501 für den Zug, 2.510 für die Validierung und 4.952 für den Test) mit 20 Klassen.
-
VOC2008 verfügt über 5.096 Bilder und Anmerkungen (2.111 für Zug, 2.221 für Validierung und 764 als Extra) mit 20 Kategorien. *Es sind 4.133 Bilder zum Testen darin, aber ignorieren Sie sie einfach.
-
VOC2009 verfügt über 7.818 Bilder und Anmerkungen (3.473 für Zug, 3.581 für Validierung und 764 für Extras) mit 20 Klassen.
-
VOC2010 verfügt über 11.321 Bilder und Anmerkungen (4.998 für Zug, 5.105 für Validierung und 1.218 für Extras) mit 20 Kategorien.
-
VOC2011 verfügt über 14.961 Bilder und Anmerkungen (5.717 für Zug, 5.823 für Validierung und 3.421 für Extras) mit 20 Klassen.
-
VOC2012 verfügt über 17.125 Bilder und Anmerkungen (5.717 für Zug, 5.823 für Validierung und 5.585 für Extras) mit 20 Klassen.
- ist VOCSegmentation() und VOCDetection() in PyTorch.
(2) SUN-Datenbank (Scene UNDerstanding-Datenbank) (2010):
- hat 108.754 Szenenbilder mit 397 Klassen.
- wird auch SUN397 genannt.
- ist SUN397() in PyTorch.
(3) Kinetik-Datensatz (2017):
- hat kurze Videoclips zu menschlichen Handlungen und es gibt die 3 Datensätze Kinetics-400, Kinetics-600 und Kinetics-700:
*Memos:
- Jeder Videoclip dauert etwa 10 Sekunden.
-
Kinetics-400 (2017) verfügt über 306.245 Videoclips, die jeweils aus 400 Kategorien (Klassen) mit dem Label verbunden sind.
-
Kinetics-600 (2018) verfügt über 495.547 mit dem Label verbundene Videoclips aus 600 Kategorien.
-
Kinetics-700 (2019) verfügt über 545.317 mit dem Label verbundene Videoclips aus 700 Kategorien.
- wird zur Videoklassifizierung verwendet.
- ist Kinetics() in PyTorch.
(4) Stadtansichten (2016):
- hat die 25.000 kommentierten städtischen Straßenszenenbilder des semantischen Verständnisses mit den 30 Klassen, die in 8 Kategorien gruppiert sind. *5.000 Bilder sind mit feinen Anmerkungen versehen und 20.000 Bilder sind mit groben Anmerkungen versehen.
- wird für die Bildsegmentierung verwendet.
- ist Cityscapes() in PyTorch. *Wie der Datensatz eingestellt wird, wird nicht erklärt.
Feinkommentierte Bilder:
Grob kommentierte Bilder:
Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (5). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!