Datensätze für Computer Vision (2)

DDD
Freigeben: 2024-11-24 13:55:14
Original
355 Leute haben es durchsucht

Kauf mir einen Kaffee☕

*Mein Beitrag erklärt MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST.

(1) Fashion-MNIST(2017):

  • hat die 70.000 Modebilder jeweils einem Label aus 10 Klassen mit 10 Klassen zugeordnet: *Memos:
    • 60.000 für den Zug und 10.000 für den Test.
    • Jedes Bild ist 28x28 Pixel groß.
  • ist FashionMNIST() in PyTorch.

Datasets for Computer Vision (2)

(2) Caltech 101 (2003):

  • hat die 8.677 Objektbilder, die jeweils mit einer Beschriftung aus 101 Kategorien (Klassen) verbunden sind. *Jedes Bild ist ungefähr 300 x 200 Pixel groß.
  • ist Caltech101() in PyTorch.

Datasets for Computer Vision (2)

(3) Caltech 256(2007):

  • hat die 30.607 Objektbilder mit einer Beschriftung aus 257 Kategorien (Klassen) verbunden. *Tatsächlich gibt es 257 Kategorien (Klassen) gegen den Namen Caltech 256.
  • ist Caltech256() in PyTorch.

Datasets for Computer Vision (2)

Datasets for Computer Vision (2)

(4) CelebA (Großformatige CelebFaces-Attribute) (2015):

  • hat die 202.599 Promi-Gesichtsbilder, die jeweils mit 40 Attributen verknüpft sind: *Memos:
    • 162.770 für den Zug, 19.867 für die Validierung und 19.962 für den Test.
    • Es wird empfohlen, es direkt von Google Drive herunterzuladen, da das Herunterladen mit der Google Drive-API von Google Drive zu aufwändig ist.
  • ist CelebA() in PyTorch.

Datasets for Computer Vision (2)

(5) CIFAR-10 (Canadian Institute For Advanced Research-10) (2009):

  • hat die 60.000 Fahrzeug- und Tierbilder jeweils mit einem Label aus 10 Klassen verbunden: *Memos:
    • 50.000 für den Zug und 10.000 für den Test.
    • Jedes Bild ist 32x32 Pixel groß.
  • ist CIFAR10() in PyTorch.

Datasets for Computer Vision (2)

(6) CIFAR-100 (Canadian Institute For Advanced Research-100) (2009):

  • hat die 60.000 Objektbilder jeweils mit einem Label aus 100 Klassen verbunden: *Memos:
    • 50.000 für den Zug und 10.000 für den Test.
    • Jedes Bild ist 32x32 Pixel groß.
  • ist CIFAR100() in PyTorch.

Datasets for Computer Vision (2)

Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (2). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:dev.to
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage