Heim > Backend-Entwicklung > Python-Tutorial > Datensätze für Computer Vision (5)

Datensätze für Computer Vision (5)

Barbara Streisand
Freigeben: 2024-12-26 16:42:15
Original
464 Leute haben es durchsucht

Kauf mir einen Kaffee☕

*Memos:

  • In meinem Beitrag werden MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST erklärt.
  • Mein Beitrag erklärt Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 und CIFAR-100.
  • In meinem Beitrag werden Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k und Flickr30k erklärt.
  • In meinem Beitrag werden ImageNet, LSUN und MS COCO erklärt.
  • In meinem Beitrag werden Bildklassifizierung (Erkennung), Objektlokalisierung, Objekterkennung und Bildsegmentierung erläutert.
  • In meinem Beitrag werden Schlüsselpunkterkennung (Landmark-Erkennung), Bildabgleich, Objektverfolgung, Stereoabgleich, Videovorhersage, optischer Fluss und Bildunterschrift erläutert.

(1) PASCAL VOC (Pattern Analysis, Statistical Modelling, and Computational Learning Visual Object Classes) (2005):

  • hat Objektbilder und Anmerkungen mit 4, 10 oder 20 Klassen und es gibt die 8 Datensätze VOC2005, VOC2006, VOC2007, VOC2008, VOC2009, VOC2010, VOC2011 und VOC2012: *Memos:
    • VOC2005 verfügt über 2.232 Bilder und Anmerkungen (einige für den Zug, einige für die Validierung und einige für Tests) mit 4 Klassen.
    • VOC2006 verfügt über 5.304 Bilder und Anmerkungen (1.277 für Zug, 1.341 für Validierung und 2.686 für Test) mit 10 Klassen.
    • VOC2007 verfügt über 9.963 Bilder und Anmerkungen (2.501 für den Zug, 2.510 für die Validierung und 4.952 für den Test) mit 20 Klassen.
    • VOC2008 verfügt über 5.096 Bilder und Anmerkungen (2.111 für Zug, 2.221 für Validierung und 764 als Extra) mit 20 Kategorien. *Es sind 4.133 Bilder zum Testen darin, aber ignorieren Sie sie einfach.
    • VOC2009 verfügt über 7.818 Bilder und Anmerkungen (3.473 für Zug, 3.581 für Validierung und 764 für Extras) mit 20 Klassen.
    • VOC2010 verfügt über 11.321 Bilder und Anmerkungen (4.998 für Zug, 5.105 für Validierung und 1.218 für Extras) mit 20 Kategorien.
    • VOC2011 verfügt über 14.961 Bilder und Anmerkungen (5.717 für Zug, 5.823 für Validierung und 3.421 für Extras) mit 20 Klassen.
    • VOC2012 verfügt über 17.125 Bilder und Anmerkungen (5.717 für Zug, 5.823 für Validierung und 5.585 für Extras) mit 20 Klassen.
  • ist VOCSegmentation() und VOCDetection() in PyTorch.

Datasets for Computer Vision (5)

(2) SUN-Datenbank (Scene UNDerstanding-Datenbank) (2010):

  • hat 108.754 Szenenbilder mit 397 Klassen.
  • wird auch SUN397 genannt.
  • ist SUN397() in PyTorch.

Datasets for Computer Vision (5)

(3) Kinetik-Datensatz (2017):

  • hat kurze Videoclips zu menschlichen Handlungen und es gibt die 3 Datensätze Kinetics-400, Kinetics-600 und Kinetics-700: *Memos:
    • Jeder Videoclip dauert etwa 10 Sekunden.
    • Kinetics-400 (2017) verfügt über 306.245 Videoclips, die jeweils aus 400 Kategorien (Klassen) mit dem Label verbunden sind.
    • Kinetics-600 (2018) verfügt über 495.547 mit dem Label verbundene Videoclips aus 600 Kategorien.
    • Kinetics-700 (2019) verfügt über 545.317 mit dem Label verbundene Videoclips aus 700 Kategorien.
  • wird zur Videoklassifizierung verwendet.
  • ist Kinetics() in PyTorch.

Datasets for Computer Vision (5)

(4) Stadtansichten (2016):

  • hat die 25.000 kommentierten städtischen Straßenszenenbilder des semantischen Verständnisses mit den 30 Klassen, die in 8 Kategorien gruppiert sind. *5.000 Bilder sind mit feinen Anmerkungen versehen und 20.000 Bilder sind mit groben Anmerkungen versehen.
  • wird für die Bildsegmentierung verwendet.
  • ist Cityscapes() in PyTorch. *Wie der Datensatz eingestellt wird, wird nicht erklärt.

Feinkommentierte Bilder:

Datasets for Computer Vision (5)

Grob kommentierte Bilder:

Datasets for Computer Vision (5)

Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (5). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:dev.to
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage