Kauf mir einen Kaffee☕
(1) MNIST (Modified National Institute of Standards and Technology) (1998):
- hat 70.000 handgeschriebene Ziffern[0~9] mit jeweils 28x28 Pixeln. *60.000 für den Zug und 10.000 für den Test.
- ist MNIST() in PyTorch.
(2) EMNIST (Extended MNIST) (2017):
- hat die handschriftlichen Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a~z]) mit jeweils 28x28 Pixeln, aufgeteilt in 6 Datensätze (ByClass, ByMerge). , Ausgewogen, Buchstaben, Ziffern und MNIST):
*Memos:
-
ByClass hat 814.255 Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a~z]). *697.932 für Zug und 116.323 für Test.
-
ByMerge hat 814.255 Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a, b, d~h, n, q, r, t]). *697.932 für Zug und 116.323 für Test.
-
Ausgewogen hat 131.600 Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a, b, d~h, n, q, r, t]). *112.800 für den Zug und 18.800 für den Test.
-
Buchstaben hat 145.600 Buchstaben[a~z]. *124.800 für den Zug und 20.800 für den Test.
-
Ziffern hat 280.000 Ziffern[0~9]. *240.000 für den Zug und 40.000 für den Test.
-
MNIST hat 70.000 Ziffern[0~9]. *60.000 für den Zug und 10.000 für den Test.
- ist EMNIST() in PyTorch.
(3) QMNIST(2019):
- hat 120.000 handschriftliche Ziffern[0~9] mit jeweils 28x28 Pixeln. *60.000 für den Zug und 60.000 für den Test.
- ist ein erweiterter MNIST. *Ich weiß nicht, was Q von QMNIST bedeutet.
- ist QMNIST() in PyTorch.
(4) ETLCDB(Extract-Transform-Load Character Database) (2011):
- hat die handgeschriebenen oder maschinell gedruckten Ziffern, Symbole, Buchstaben und japanischen Zeichen in 9 Datensätze aufgeteilt (ETL-1, ETL-2, ETL-3). , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8 und ETL-9) : : : : : : : : : : : : : : : : : : : : :
*Memos:
-
ETL1 hat 141.319 Zeichen (Ziffern[0~9], Buchstaben[A~Z], Symbole[-*/=()・,?'] und Katakana[ア~ン]).
-
ETL2 hat 52.796 Zeichen (Ziffern[0~9], Buchstaben[A~Z], Symbole, Katakana-Buchstaben[ア~ン], Hiragana-Buchstaben[あ~ん] und Kanji-Buchstaben).
-
ETL3 hat 9.600 Zeichen (Ziffern[0~9], Buchstaben[A~Z] und Symbole[¥ -*/=()・,_▾]).
-
ETL4 hat 6.120 Buchstaben[あ~ん].
-
ETL5 hat 10.608 Katakana-Buchstaben[ア~ン].
-
ETL6 hat 52.796 Zeichen (Ziffern[0~9], Buchstaben[A~Z][a~z], Symbole und Katakana-Buchstaben[ア~ン]).
-
ETL7(ETL7L und ETL7S) hat 16.800 Zeichen
- ETL8(ETL8G und ETL8B2) hat 152.960 Zeichen
ETL9(ETL9G und ETL9B)- hat 607.200 Zeichen
Es ist nicht in PyTorch, daher müssen wir es von etlcdb herunterladen.
-
(5) Kuzushiji(2018):
Der Kursivstil japanischer Schriftzeichen ist in drei Datensätze unterteilt (
Kuzushiji-MNIST
, - Kuzushiji-49 und Kuzushiji-Kanji):
*Memos:
Kuzushiji-MNIST
hat eine Auflösung von 28 x 28 Pixel
-
Kuzushiji-49 hat jeweils 28x28 Pixel
Kuzushiji-49-
Kuzushiji-Kanji
hat die unausgewogenen 140.424 Kanji-Zeichen mit jeweils 64 x 64 Pixeln.-
KMNIST() ist in PyTorch, hat aber nur
Kuzushiji-MNIST 🎜>
-
(6) Moving MNIST(2015):
hat 10.000 Videos mit jeweils 64 x 64 Pixeln. *Jedes Video hat 20 Bilder mit 2 beweglichen Ziffern.
MovingMNIST() ist in PyTorch.
Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (1). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!