コーヒー買ってきて☕
(1) MNIST(修正国立標準技術研究所)(1998):
- には、それぞれ 28x28 ピクセルの 70,000 個の手書き数字 [0 ~ 9] があります。 *電車の場合は 60,000、テストの場合は 10,000。
- は PyTorch の MNIST() です。
(2) EMNIST(拡張MNIST)(2017):
- には手書き文字(数字[0~9]とアルファベット[A~Z][a~z])があり、それぞれ28x28ピクセルで6つのデータセット(ByClass、ByMerge)に分割されています。 、バランスのとれた、 文字、数字、および MNIST):
*メモ:
-
ByClass には 814,255 文字(数字[0~9]とアルファベット[A~Z][a~z])があります。 *電車用は 697,932 個、テスト用は 116,323 個。
-
ByMerge には 814,255 文字 (数字[0~9] とアルファベット[A~Z][a, b, d~h, n, q, r, t]) があります。 *電車用は 697,932 個、テスト用は 116,323 個。
-
Balanced には 131,600 文字 (数字[0~9] とアルファベット[A~Z][a, b, d~h, n, q, r, t]) があります。 *電車の場合は 112,800、テストの場合は 18,800。
-
文字には、145,600 個のアルファベット文字[a~z]があります。 *電車の場合は 124,800、テストの場合は 20,800。
-
桁 には 280,000 桁[0~9]があります。 *電車の場合は 240,000、テストの場合は 40,000。
-
MNIST には 70,000 桁[0~9]があります。 *電車の場合は 60,000、テストの場合は 10,000。
- は PyTorch の EMNIST() です。
(3) QMNIST(2019):
- には、それぞれ 28x28 ピクセルの 120,000 個の手書き数字 [0 ~ 9] があります。 *電車の場合は 60,000、テストの場合は 60,000。
- は拡張 MNIST です。 ※QMNISTのQの意味が分かりません。
- は PyTorch の QMNIST() です。
(4) ETLCDB(文字データベースの抽出-変換-ロード)(2011):
- には、手書きまたは機械で印刷された数字、記号、アルファベット、日本語文字が 9 つのデータセット (ETL-1、ETL-2、ETL-3) に分割されています。 、ETL-4、 ETL-5、ETL-6、ETL-7、ETL-8、および ETL-9) : : : : : : : : : : : : : : : : : : : : :
*メモ:
-
ETL1 は 141,319 文字 (数字[0~9]、アルファベット[A~Z]、記号[-*/=()・、?']、カタカナ[ア~ン])です。
-
ETL2 には、52,796 文字(数字[0~9]、アルファベット[A~Z]、記号、カタカナ[ア~ン]、ひらがな[あ~ん]、漢字)が含まれています。
-
ETL3は9,600文字(数字[0~9]、アルファベット[A~Z]、記号[¥ -*/=()・,_▾])を含みます。
-
ETL4 には 6,120 文字あります[あ~ん]。
-
ETL5 には 10,608 個のカタカナ文字 [ア~ン] があります。
-
ETL6 には、52,796 文字 (数字[0~9]、アルファベット[A~Z][a~z]、記号およびカタカナ文字[ア~ン])があります。
-
ETL7(ETL7L および ETL7S) には 16,800 文字があります
- ETL8(ETL8G および ETL8B2) には 152,960 文字があります
ETL9(ETL9G および ETL9B)- には 607,200 文字があります
これは PyTorch には含まれていないため、etlcdb からダウンロードする必要があります。
-
(5)くずし字(2018):
日本語の筆記体は 3 つのデータセット (
くずし字-MNIST
、- くずし字-49、および くずし字-漢字) に分割されています。
*メモ:
Kuzushiji-MNIST
の解像度は 28x28 ピクセルです
-
くずし字-49 はそれぞれ 28x28 ピクセルです
くずし字-49-
くずし字漢字
には、64x64 ピクセルごとに 140,424 個の漢字がバランスよく配置されています。-
KMNIST() は PyTorch にありますが、
Kuzushiji-MNIST しかありません 🎜>
-
(6) 動くMNIST(2015):
には、それぞれ 64x64 ピクセルのビデオが 10,000 件あります。 *各ビデオには 2 つの動く数字を含む 20 フレームがあります。
MovingMNIST() は PyTorch にあります。
以上がコンピュータービジョン用のデータセット (1)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。