Beli Saya Kopi☕
*Memo:
-
Siaran saya menerangkan MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji dan Moving MNIST.
-
Siaran saya menerangkan Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 dan CIFAR-100.
-
Siaran saya menerangkan Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k dan Flickr30k.
(1) ImageNet(2009):
- mempunyai 1,331,167 imej objek(1,281,167 untuk kereta api dan 50,000 untuk pengesahan) setiap satu disambungkan kepada label daripada 1000 kelas:
*Memo:
- Setiap kelas mempunyai satu atau lebih nama yang mewakili perkara yang sama.
- Anda boleh memuat turun ILSVRC2012_devkit_t12.tar.gz, ILSVRC2012_img_train.tar dan ILSVRC2012_img_val.tar.
- ialah ImageNet() dalam PyTorch.
(2) LSUN(Pemahaman Adegan Berskala Besar)(2015):
- mempunyai imej pemandangan dan terdapat 10 set data Bilik Tidur, Jambatan, Church Outdoor, Bilik Darjah, Bilik Persidangan , Ruang Makan, Dapur, Ruang Tamu, Restoran dan Menara:
-
Bilik Tidur mempunyai 3,033,342 imej bilik tidur(3,033,042 untuk kereta api dan 300 untuk pengesahan).
-
Jambatan mempunyai 818,987 imej jambatan(818,687 untuk kereta api dan 300 untuk pengesahan).
-
Church Outdoor mempunyai 126,527 imej luar gereja(126,227 untuk kereta api dan 300 untuk pengesahan).
-
Bilik Darjah mempunyai 126,527 imej bilik darjah(126,227 untuk kereta api dan 300 untuk pengesahan).
-
Bilik Persidangan mempunyai 229,369 imej bilik persidangan(229,069 untuk kereta api dan 300 untuk pengesahan).
-
Bilik Makan mempunyai 657,871 imej ruang makan(657,571 untuk kereta api dan 300 untuk pengesahan).
-
Dapur mempunyai 2,212,577 imej dapur(2,212,277 untuk kereta api dan 300 untuk pengesahan).
-
Ruang Tamu mempunyai 1,316,102 imej ruang tamu(1,315,802 untuk kereta api dan 300 untuk pengesahan).
-
Restoran mempunyai 626,631 imej restoran(626,331 untuk kereta api dan 300 untuk pengesahan).
-
Menara mempunyai 708,564 imej menara(708,264 untuk kereta api dan 300 untuk pengesahan).
- ialah LSUN() dalam PyTorch tetapi ia mempunyai pepijat.
(3) MS COCO(Microsoft Common Objects in Context)(2014):
- mempunyai imej objek dengan anotasi dan terdapat 16 set data 2014 Train images dan 2014 Val images dengan 2014 Train/Val anotasi, 2014 Uji imej dengan Imej Pengujian 2014 info, imej Ujian 2015 dengan maklumat Imej Ujian 2015, imej Latih 2017 dan imej Val 2017 dengan 2017 Anotasi Train/Val, anotasi Stuff Train/Val 2017 atau anotasi Kereta Api/Val Panoptic 2017, Imej Ujian 2017 dengan maklumat Imej Ujian 2017 dan dengan Maklumat Imej Tidak Berlabel 2017:
*Memo:
- Imej kereta api 2014 mempunyai 82,782 imej.
- Imej Val 2014 mempunyai 40,504 imej.
- anotasi Train/Val 2014 mempunyai 123,286 anotasi(82,782 untuk kereta api dan 40,504 untuk pengesahan) untuk imej Keretapi 2014 dan imej Val 2014.
- Imej ujian 2014 mempunyai 40,775 imej.
- Maklumat Imej Ujian 2014 mempunyai 40,775 anotasi untuk Imej Ujian 2014.
- Imej ujian 2015 mempunyai 81,434 imej.
- Maklumat Imej Ujian 2015 mempunyai 81,434 anotasi untuk imej Ujian 2015.
- Imej kereta api 2017 mempunyai 118,287 imej.
- Imej Val 2017 mempunyai 5,000 imej.
- anotasi Train/Val 2017 mempunyai 123,287 anotasi(118,287 untuk kereta api dan 5,000 untuk pengesahan) untuk imej Keretapi 2017 dan imej Val 2017.
- anotasi Stuff Train/Val 2017 mempunyai 123,287 anotasi(118,287 untuk kereta api dan 5,000 untuk pengesahan) untuk imej Keretapi 2017 dan imej Val 2017..
- anotasi Kereta Api/Val Panoptic 2017 mempunyai 123,287 anotasi(118,287 untuk kereta api dan 5,000 untuk pengesahan) untuk imej Kereta Api 2017 dan imej Val 2017..
- Imej ujian 2017 mempunyai 40,670 imej.
- Maklumat Imej Ujian 2017 mempunyai 40,670 anotasi untuk Imej Ujian 2017.
- Imej tidak berlabel 2017 mempunyai 123,403 imej.
- Maklumat Imej Tidak Berlabel 2017 mempunyai 123,403 anotasi untuk Imej Tidak Berlabel 2017.
juga dipanggil COCO sahaja.-
ialah CocoDetection() atau CocoCaptions()
-
Atas ialah kandungan terperinci Set Data untuk Penglihatan Komputer (4). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!