ホームページ > バックエンド開発 > Python チュートリアル > コンピュータービジョン用のデータセット (1)

コンピュータービジョン用のデータセット (1)

Linda Hamilton
リリース: 2024-12-17 14:16:11
オリジナル
627 人が閲覧しました

コーヒー買ってきて☕

(1) MNIST(修正国立標準技術研究所)(1998):

  • には、それぞれ 28x28 ピクセルの 70,000 個の手書き数字 [0 ~ 9] があります。 *電車の場合は 60,000、テストの場合は 10,000。
  • は PyTorch の MNIST() です。

Datasets for Computer Vision (1)

(2) EMNIST(拡張MNIST)(2017):

  • には手書き文字(数字[0~9]とアルファベット[A~Z][a~z])があり、それぞれ28x28ピクセルで6つのデータセット(ByClassByMerge)に分割されています。 バランスのとれた文字数字、および MNIST): *メモ:
    • ByClass には 814,255 文字(数字[0~9]とアルファベット[A~Z][a~z])があります。 *電車用は 697,932 個、テスト用は 116,323 個。
    • ByMerge には 814,255 文字 (数字[0~9] とアルファベット[A~Z][a, b, d~h, n, q, r, t]) があります。 *電車用は 697,932 個、テスト用は 116,323 個。
    • Balanced には 131,600 文字 (数字[0~9] とアルファベット[A~Z][a, b, d~h, n, q, r, t]) があります。 *電車の場合は 112,800、テストの場合は 18,800。
    • 文字には、145,600 個のアルファベット文字[a~z]があります。 *電車の場合は 124,800、テストの場合は 20,800。
    • には 280,000 桁[0~9]があります。 *電車の場合は 240,000、テストの場合は 40,000。
    • MNIST には 70,000 桁[0~9]があります。 *電車の場合は 60,000、テストの場合は 10,000。
  • は PyTorch の EMNIST() です。

Datasets for Computer Vision (1)

(3) QMNIST(2019):

  • には、それぞれ 28x28 ピクセルの 120,000 個の手書き数字 [0 ~ 9] があります。 *電車の場合は 60,000、テストの場合は 60,000。
  • は拡張 MNIST です。 ※QMNISTのQの意味が分かりません。
  • は PyTorch の QMNIST() です。

Datasets for Computer Vision (1)

(4) ETLCDB(文字データベースの抽出-変換-ロード)(2011):

  • には、手書きまたは機械で印刷された数字、記号、アルファベット、日本語文字が 9 つのデータセット (ETL-1ETL-2ETL-3) に分割されています。 ETL-4ETL-5ETL-6ETL-7ETL-8、および ETL-9) : : : : : : : : : : : : : : : : : : : : : *メモ:
    • ETL1 は 141,319 文字 (数字[0~9]、アルファベット[A~Z]、記号[-*/=()・、?']、カタカナ[ア~ン])です。
    • ETL2 には、52,796 文字(数字[0~9]、アルファベット[A~Z]、記号、カタカナ[ア~ン]、ひらがな[あ~ん]、漢字)が含まれています。
    • ETL3は9,600文字(数字[0~9]、アルファベット[A~Z]、記号[¥ -*/=()・,_▾])を含みます。
    • ETL4 には 6,120 文字あります[あ~ん]。
    • ETL5 には 10,608 個のカタカナ文字 [ア~ン] があります。
    • ETL6 には、52,796 文字 (数字[0~9]、アルファベット[A~Z][a~z]、記号およびカタカナ文字[ア~ン])があります。
    • ETL7(ETL7L および ETL7S) には 16,800 文字があります
    • ETL8(ETL8G および ETL8B2) には 152,960 文字があります
    • ETL9(ETL9G および ETL9B)
    • には 607,200 文字があります
    • これは PyTorch には含まれていないため、etlcdb からダウンロードする必要があります。

(5)くずし字(2018):Datasets for Computer Vision (1)

日本語の筆記体は 3 つのデータセット (

くずし字-MNIST
  • くずし字-49、および くずし字-漢字) に分割されています。 *メモ: Kuzushiji-MNIST
      の解像度は 28x28 ピクセルです
    • くずし字-49 はそれぞれ 28x28 ピクセルです
    • くずし字-49
    • くずし字漢字
    • には、64x64 ピクセルごとに 140,424 個の漢字がバランスよく配置されています。
    • KMNIST() は PyTorch にありますが、
    Kuzushiji-MNIST
  • しかありません 🎜>
  • (6) 動くMNIST(2015):
  • には、それぞれ 64x64 ピクセルのビデオが 10,000 件あります。 *各ビデオには 2 つの動く数字を含む 20 フレームがあります。

MovingMNIST() は PyTorch にあります。Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

以上がコンピュータービジョン用のデータセット (1)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:dev.to
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート