請我喝杯咖啡☕
*備忘錄:
-
我的貼文解釋了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。
-
我的貼文解釋了 Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10 和 CIFAR-100。
-
我的貼文解釋了 Oxford-IIIT Pet、Oxford 102 Flower、Stanford Cars、Places365、Flickr8k 和 Flickr30k。
-
我的文章解釋了 ImageNet、LSUN 和 MS COCO。
-
我的文章解釋了影像分類(辨識)、物件定位、物件偵測和影像分割。
-
我的貼文解釋了關鍵點檢測(地標檢測)、影像匹配、物件追蹤、立體匹配、視訊預測、光流、影像字幕。
(1) PASCAL VOC(模式分析、統計建模與計算學習視覺物件類別)(2005):
- 具有4、10 或20 個類別的物件影像和註釋,並且有8 個資料集VOC2005、VOC2006、VOC2007、、VOC2007、、 VOC2008, VOC2009、VOC2010、
VOC2011- 和
VOC2012- :
*備註:
-
VOC2005 有 2,232 個圖像和註釋(一些用於訓練,一些用於驗證,一些用於測試),分為 4 個類別。
-
VOC2006 有 5,304 個圖像和註釋(1,277 個用於訓練,1,341 個用於驗證,2,686 個用於測試),共 10 個類別。
-
VOC2007 有 9,963 個圖像和註釋(2,501 個用於訓練,2,510 個用於驗證,4,952 個用於測試),共 20 個類別。
-
VOC2008 有 5,096 個圖像和註釋(2,111 個用於訓練,2,221 個用於驗證,764 個作為額外),有 20 個類別。 *裡面有4,133張測試圖片,忽略它們。
-
VOC2009 有 7,818 個圖像和註釋(3,473 個用於訓練,3,581 個用於驗證,764 個作為額外),有 20 個類別。
-
VOC2010 有 11,321 個圖像和註釋(4,998 個用於訓練,5,105 個用於驗證,1,218 個作為額外),有 20 個類別。
VOC2011 有 14,961 個圖像和註釋(5,717 個用於訓練,5,823 個用於驗證,3,421 個額外),有 20 個類別。
-
VOC2012 有 17,125 個圖像和註釋(5,717 個用於訓練,5,823 個用於驗證,5,585 個作為額外),有 20 個類別。
是 PyTorch 中的 VOCSegmentation() 和 VOCDetection()。
-
(2) SUN 資料庫(場景理解資料庫)(2010):-
- 有 108,754 個場景影像,397 個類別。
也稱為SUN397。
是 PyTorch 中的 SUN397()。
(3) 動力學資料集(2017):
- 有人類動作短片,有3個資料集Kinetics-400、Kinetics-600和Kinetics-700:
*備註:
- 每個影片片段持續約10秒。
-
Kinetics-400(2017) 有 306,245 個影片剪輯,每個影片剪輯都連接到來自 400 個類別的標籤。
-
Kinetics-600(2018) 有 495,547 個影片剪輯,每個影片剪輯都連接到來自 600 個類別的標籤。
-
Kinetics-700(2019) 有 545,317 個影片剪輯,每個影片剪輯都連接到來自 700 個類別的標籤。
- 用於視訊分類。
- 是 PyTorch 中的 Kinetics()。
(4)城市景觀(2016):
- 擁有 25,000 張附註釋的語意理解城市街景影像,分為 8 個類別 30 個類別。 *5,000 張影像進行精細標註,20,000 張影像進行粗標註。
- 用於影像分割。
- 是 PyTorch 中的 Cityscapes()。 *如何設定資料集沒有解釋。
精細註解的圖像:
粗略註解的圖像:
以上是電腦視覺資料集 (5)的詳細內容。更多資訊請關注PHP中文網其他相關文章!