Rumah > pembangunan bahagian belakang > Tutorial Python > Set Data untuk Penglihatan Komputer (3)

Set Data untuk Penglihatan Komputer (3)

Linda Hamilton
Lepaskan: 2024-12-03 10:00:24
asal
429 orang telah melayarinya

Beli Saya Kopi☕

*Memo:

  • Siaran saya menerangkan MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji dan Moving MNIST.
  • Siaran saya menerangkan Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 dan CIFAR-100.

(1) Oxford-IIIT Pet(2012):

  • mempunyai 7,349 imej kucing dan anjing setiap satu disambungkan ke label daripada 37 kelas: *Memo:
    • Setiap kelas mempunyai kira-kira 200 imej.
    • 3,680 untuk kereta api atau kereta api dan pengesahan dan 3,669 untuk ujian.
  • ialah OxfordIIITPet() dalam PyTorch.

Datasets for Computer Vision (3)

(2) Oxford 102 Flower(2008):

  • mempunyai 8,189 imej bunga(1,020 untuk kereta api, 1,020 untuk pengesahan dan 6,149 untuk ujian) dengan 102 kategori(kelas). *Setiap kelas mempunyai 40 hingga 258 imej.
  • ialah Flowers102() dalam PyTorch.

Datasets for Computer Vision (3)

(3) Kereta Stanford(2013):

  • mempunyai 16185 imej kereta(8,144 untuk kereta api dan 8,041 untuk ujian) dengan 196 kelas.
  • ialah StanfordCars() dalam PyTorch.

Datasets for Computer Vision (3)

(4) Places365(2017):

  • mempunyai imej adegan dengan 365 kategori adegan(kelas) daripada 434 kategori adegan(kelas) dalam Pangkalan Data Tempat dan terdapat Places365-Standard, Places365-Challenge dan Tempat-Extra69 yang anda boleh lihat di sini: *Memo:
    • Places365-Standard mempunyai 2,168,460 imej(1,803,460 untuk kereta api, 36,500 untuk pengesahan dan 328,500 untuk ujian) dengan 365 kategori(kelas) daripada 434 kategori dalam Pangkalan Data Tempat. *Terdapat 50 imej bagi setiap kategori(kelas) dalam set pengesahan dan 900 imej bagi setiap kategori(kelas) dalam set ujian.
    • Places365-Challenge mempunyai 8,391,628 imej(8,026,628 untuk kereta api, 36,500 untuk pengesahan dan 328,500 untuk ujian), menambah 6,223,168 imej tambahan pada set kereta api 🎜>Placesd.Places.
    • Places-Extra69 mempunyai 105,321 imej(98,721 untuk kereta api dan 6,600 untuk ujian) dengan tambahan 69 kategori(kelas) daripada 434 kategori(kelas) dalam Pangkalan Data Tempat. *Pada masa ini, ia tidak boleh dimuat turun.
  • ialah Places365() dalam PyTorch.

Datasets for Computer Vision (3)

(5) Flickr8k(2013):

  • mempunyai 8,091 imej yang diperoleh daripada flickr dengan lima kapsyen berbeza untuk setiap imej.
  • adalah Flickr8k() dalam PyTorch tetapi ia tidak menerangkan cara menyediakan set data kepadanya jadi saya tidak tahu cara memuatkan set data dengannya.

Datasets for Computer Vision (3)

(6) Flickr30k(2015):

  • mempunyai 31,784 imej yang diperoleh daripada flickr dengan lima kapsyen berbeza untuk setiap imej.
  • adalah Flickr8k() dalam PyTorch tetapi ia tidak menerangkan cara menyediakan set data kepadanya jadi saya tidak tahu cara memuatkan set data dengannya.

Datasets for Computer Vision (3)

Atas ialah kandungan terperinci Set Data untuk Penglihatan Komputer (3). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan