Kauf mir einen Kaffee☕
*Mein Beitrag erklärt MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji und Moving MNIST.
(1) Fashion-MNIST(2017):
- hat die 70.000 Modebilder jeweils einem Label aus 10 Klassen mit 10 Klassen zugeordnet:
*Memos:
- 60.000 für den Zug und 10.000 für den Test.
- Jedes Bild ist 28x28 Pixel groß.
- ist FashionMNIST() in PyTorch.
(2) Caltech 101 (2003):
- hat die 8.677 Objektbilder, die jeweils mit einer Beschriftung aus 101 Kategorien (Klassen) verbunden sind. *Jedes Bild ist ungefähr 300 x 200 Pixel groß.
- ist Caltech101() in PyTorch.
(3) Caltech 256(2007):
- hat die 30.607 Objektbilder mit einer Beschriftung aus 257 Kategorien (Klassen) verbunden. *Tatsächlich gibt es 257 Kategorien (Klassen) gegen den Namen Caltech 256.
- ist Caltech256() in PyTorch.
(4) CelebA (Großformatige CelebFaces-Attribute) (2015):
- hat die 202.599 Promi-Gesichtsbilder, die jeweils mit 40 Attributen verknüpft sind:
*Memos:
- 162.770 für den Zug, 19.867 für die Validierung und 19.962 für den Test.
- Es wird empfohlen, es direkt von Google Drive herunterzuladen, da das Herunterladen mit der Google Drive-API von Google Drive zu aufwändig ist.
- ist CelebA() in PyTorch.
(5) CIFAR-10 (Canadian Institute For Advanced Research-10) (2009):
- hat die 60.000 Fahrzeug- und Tierbilder jeweils mit einem Label aus 10 Klassen verbunden:
*Memos:
- 50.000 für den Zug und 10.000 für den Test.
- Jedes Bild ist 32x32 Pixel groß.
- ist CIFAR10() in PyTorch.
(6) CIFAR-100 (Canadian Institute For Advanced Research-100) (2009):
- hat die 60.000 Objektbilder jeweils mit einem Label aus 100 Klassen verbunden:
*Memos:
- 50.000 für den Zug und 10.000 für den Test.
- Jedes Bild ist 32x32 Pixel groß.
- ist CIFAR100() in PyTorch.
Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (2). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!