Beli Saya Kopi☕
(1) MNIST(Institut Piawaian dan Teknologi Kebangsaan yang Diubahsuai)(1998):
- mempunyai 70,000 digit tulisan tangan[0~9] dengan 28x28 piksel setiap satu. *60,000 untuk kereta api dan 10,000 untuk ujian.
- ialah MNIST() dalam PyTorch.
(2) EMNIST(Extended MNIST)(2017):
- mempunyai aksara tulisan tangan(digit[0~9] dan huruf abjad[A~Z][a~z]) sebanyak 28x28 piksel setiap satu, dibahagikan kepada 6 set data(ByClass, ByMerge , Seimbang, Huruf, Digit dan MNIST):
*Memo:
-
ByClass mempunyai 814,255 aksara(digit[0~9] dan huruf abjad[A~Z][a~z]). *697,932 untuk kereta api dan 116,323 untuk ujian.
-
ByMerge mempunyai 814,255 aksara(digit[0~9] dan huruf abjad[A~Z][a, b, d~h, n, q, r, t]). *697,932 untuk kereta api dan 116,323 untuk ujian.
-
Seimbang mempunyai 131,600 aksara(digit[0~9] dan huruf abjad[A~Z][a, b, d~h, n, q, r, t]). *112,800 untuk kereta api dan 18,800 untuk ujian.
-
Huruf mempunyai 145,600 huruf abjad[a~z]. *124,800 untuk kereta api dan 20,800 untuk ujian.
-
Digit mempunyai 280,000 digit[0~9]. *240,000 untuk kereta api dan 40,000 untuk ujian.
-
MNIST mempunyai 70,000 digit[0~9]. *60,000 untuk kereta api dan 10,000 untuk ujian.
- ialah EMNIST() dalam PyTorch.
(3) QMNIST(2019):
- mempunyai 120,000 digit tulisan tangan[0~9] kali 28x28 piksel setiap satu. *60,000 untuk kereta api dan 60,000 untuk ujian.
- adalah MNIST lanjutan. *Saya tidak tahu apa maksud Q QMNIST.
- ialah QMNIST() dalam PyTorch.
(4) ETLCDB(Extract-Transform-Load Character Database)(2011):
- mempunyai angka, simbol, huruf abjad dan aksara Jepun tulisan tangan atau cetakan mesin yang dibahagikan kepada 9 set data(ETL-1, ETL-2, ETL-3 , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8 dan ETL-9) : : : : : : : : : : : : : : : : : : : : :
*Memo:
-
ETL1 mempunyai 141,319 aksara (digit[0~9], huruf abjad[A~Z], simbol[-*/=()・,?'] dan Katakana[ア~ン]).
-
ETL2 mempunyai 52,796 aksara(digit[0~9], huruf abjad[A~Z], simbol, huruf Katakana[ア~ン], huruf Hiragana[あ~ん] dan huruf Kanji).
-
ETL3 mempunyai 9,600 aksara(digit[0~9], huruf abjad[A~Z] dan simbol[¥ -*/=()・,_▾]).
-
ETL4 mempunyai 6,120 huruf[あ~ん].
-
ETL5 mempunyai 10,608 huruf Katakana[ア~ン].
-
ETL6 mempunyai 52,796 aksara (digit[0~9], huruf abjad[A~Z][a~z], simbol dan huruf Katakana[ア~ン]).
-
ETL7(ETL7L dan ETL7S) mempunyai 16,800 aksara
- ETL8(ETL8G dan ETL8B2) mempunyai 152,960 aksara
ETL9(ETL9G dan ETL9B)- mempunyai 607,200 aksara
Ia tiada dalam PyTorch jadi kami perlu memuat turunnya daripada etlcdb.
-
(5) Kuzushiji(2018):
Gaya kursif aksara Jepun dibahagikan kepada 3 set data(
Kuzushiji-MNIST
, - Kuzushiji-49 dan Kuzushiji-Kanji):
*Memo:
Kuzushiji-MNIST
mempunyai resolusi 28x28 piksel
-
Kuzushiji-49 mempunyai 28x28 piksel setiap satu
Kuzushiji-49-
Kuzushiji-Kanji
mempunyai 140,424 aksara Kanji yang tidak seimbang dengan 64x64 piksel setiap satu.-
KMNIST() ada dalam PyTorch tetapi ia hanya mempunyai
Kuzushiji-MNIST 🎜>
-
(6) MNIST Bergerak(2015):
mempunyai 10,000 video dengan 64x64 piksel setiap satu. *Setiap video mempunyai 20 bingkai dengan 2 digit bergerak.
MovingMNIST() berada dalam PyTorch.
Atas ialah kandungan terperinci Set Data untuk Penglihatan Komputer (1). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!