Datensätze für Computer Vision (1)
Dec 17, 2024 pm 02:16 PMKauf mir einen Kaffee☕
(1) MNIST (Modified National Institute of Standards and Technology) (1998):
- hat 70.000 handgeschriebene Ziffern[0~9] mit jeweils 28x28 Pixeln. *60.000 für den Zug und 10.000 für den Test.
- ist MNIST() in PyTorch.
(2) EMNIST (Extended MNIST) (2017):
- hat die handschriftlichen Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a~z]) mit jeweils 28x28 Pixeln, aufgeteilt in 6 Datensätze (ByClass, ByMerge). , Ausgewogen, Buchstaben, Ziffern und MNIST):
*Memos:
- ByClass hat 814.255 Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a~z]). *697.932 für Zug und 116.323 für Test.
- ByMerge hat 814.255 Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a, b, d~h, n, q, r, t]). *697.932 für Zug und 116.323 für Test.
- Ausgewogen hat 131.600 Zeichen (Ziffern[0~9] und Buchstaben[A~Z][a, b, d~h, n, q, r, t]). *112.800 für den Zug und 18.800 für den Test.
- Buchstaben hat 145.600 Buchstaben[a~z]. *124.800 für den Zug und 20.800 für den Test.
- Ziffern hat 280.000 Ziffern[0~9]. *240.000 für den Zug und 40.000 für den Test.
- MNIST hat 70.000 Ziffern[0~9]. *60.000 für den Zug und 10.000 für den Test.
- ist EMNIST() in PyTorch.
(3) QMNIST(2019):
- hat 120.000 handschriftliche Ziffern[0~9] mit jeweils 28x28 Pixeln. *60.000 für den Zug und 60.000 für den Test.
- ist ein erweiterter MNIST. *Ich weiß nicht, was Q von QMNIST bedeutet.
- ist QMNIST() in PyTorch.
(4) ETLCDB(Extract-Transform-Load Character Database) (2011):
- hat die handgeschriebenen oder maschinell gedruckten Ziffern, Symbole, Buchstaben und japanischen Zeichen in 9 Datensätze aufgeteilt (ETL-1, ETL-2, ETL-3). , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8 und ETL-9) : : : : : : : : : : : : : : : : : : : : :
*Memos:
- ETL1 hat 141.319 Zeichen (Ziffern[0~9], Buchstaben[A~Z], Symbole[-*/=()・,?'] und Katakana[ア~ン]).
- ETL2 hat 52.796 Zeichen (Ziffern[0~9], Buchstaben[A~Z], Symbole, Katakana-Buchstaben[ア~ン], Hiragana-Buchstaben[あ~ん] und Kanji-Buchstaben).
- ETL3 hat 9.600 Zeichen (Ziffern[0~9], Buchstaben[A~Z] und Symbole[¥ -*/=()・,_▾]).
- ETL4 hat 6.120 Buchstaben[あ~ん].
- ETL5 hat 10.608 Katakana-Buchstaben[ア~ン].
- ETL6 hat 52.796 Zeichen (Ziffern[0~9], Buchstaben[A~Z][a~z], Symbole und Katakana-Buchstaben[ア~ン]).
- ETL7(ETL7L und ETL7S) hat 16.800 Zeichen
- ETL8(ETL8G und ETL8B2) hat 152.960 Zeichen ETL9(ETL9G und ETL9B)
- hat 607.200 Zeichen Es ist nicht in PyTorch, daher müssen wir es von etlcdb herunterladen.
(5) Kuzushiji(2018):
Der Kursivstil japanischer Schriftzeichen ist in drei Datensätze unterteilt (
Kuzushiji-MNIST- ,
- Kuzushiji-49 und Kuzushiji-Kanji):
*Memos:
Kuzushiji-MNIST
- hat eine Auflösung von 28 x 28 Pixel
- Kuzushiji-49 hat jeweils 28x28 Pixel Kuzushiji-49
- Kuzushiji-Kanji hat die unausgewogenen 140.424 Kanji-Zeichen mit jeweils 64 x 64 Pixeln.
- KMNIST() ist in PyTorch, hat aber nur
🎜>
- (6) Moving MNIST(2015): hat 10.000 Videos mit jeweils 64 x 64 Pixeln. *Jedes Video hat 20 Bilder mit 2 beweglichen Ziffern.
MovingMNIST() ist in PyTorch.
Das obige ist der detaillierte Inhalt vonDatensätze für Computer Vision (1). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heißer Artikel

Hot-Tools-Tags

Heißer Artikel

Heiße Artikel -Tags

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wie benutze ich eine schöne Suppe, um HTML zu analysieren?

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden

Wie man mit PDF -Dokumenten mit Python arbeitet

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch?

Serialisierung und Deserialisierung von Python -Objekten: Teil 1

So implementieren Sie Ihre eigene Datenstruktur in Python
