改進的檢測演算法:用於高解析度光學遙感影像目標檢測
01 前景摘要
目前,難以在偵測效率和偵測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。
02 背景&動機
隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標偵測在遠感影像的解釋中起著至關重要的作用,可用於遠感影像的分割、描述和目標追蹤。然而,由於其相對較大的視野和高海拔的必要性,航空光學遠感影像表現出尺度、視點特異性、隨機定向和高背景複雜性的多樣性,而大多數傳統資料集包含地面視圖。因此,用於建構人工特徵檢測技術傳統上在精度和速度方面具有較大差異的記錄。由於社會的需求和深度學習發展的支持,在光學遠感影像中使用神經網路進行目標檢測是必要的。
目前結合深度學習分析光學遠感照片的目標偵測演算法可分為有監督、無監督和弱監督三種。然而,由於無監督和弱監督演算法的複雜性和不確定性,監督演算法是最常用的演算法。此外,監督目標偵測演算法可分為單階段或兩階段。基於飛機通常位於機場,船舶通常位於港口和海洋的假設,在下採樣星圖像中檢測機場和港口,然後將發現的目標映射回原始的超高分辨率衛星圖像,可以同時檢測不同大小的物體。有研究者提出了一種基於RCNN的旋轉目標偵測方法,透過解決目標方向的隨機化問題,提高遙感影像中目標偵測的準確性。
03 新演算法研究
目前的大多數YOLO系列偵測頭都是基於FPN和PAFPN的輸出特性,其中基於FPN的網絡,如YOLOv3,及其變體如下圖a所示,它們直接利用單向融合特性進行輸出。而基於PAFPN演算法的YOLOv4和YOLOv5在此基礎上增加了一個低電平到高電平的通道,它直接向上傳輸低階訊號(下圖b)。
如上圖所示,在一些研究中,TPH-YOLOv5模型中的特定偵測任務新增了一個偵測頭。在上圖b和c中,只有PAFPN功能可以用於輸出,而FPN功能未充分利用。因此,YOLOv7將三個輔助磁頭連接到FPN輸出,如上圖d所示,儘管輔助磁頭僅用於“粗糧選擇”,並且重量評估較低。 SSD的檢測頭是為了改善YOLO網路對錨集過於粗糙的設計而提出的,並提出了基於多尺度的密集錨設計組成。如圖f所示,此策略可以同時利用PANet和FPN的特徵資訊。此外,還有64倍下採樣處理直接加入了輸出,這使得網路包含先前的全域資訊。
多重偵測頭方法可以有效地利用網路的輸出特性。改進的YOLO是一個用於高解析度遙感照片的目標偵測網路。如下圖所示:
主幹網的基本架構是以C3和卷積模組為核心的CSP密集網路。在資料增強之後,影像被饋送到網路中,並且在核大小為6的Conv模組進行通道混合之後,許多卷積模組進行特徵檢索。在名為SPPF的特徵增強模組之後,它們連接到Neck的PANet。為了提高網路的偵測能力,進行了雙向特徵融合。 Conv2d用於獨立擴展融合的特徵層,以產生多層輸出。如下圖所示,NMS演算法將所有單層偵測器的輸出組合在一起,產生最終的偵測幀。
下圖b描述了改進的YOLO網路每個模組的結構組成。
Conv包括2D卷積層、BN層批量歸一化和Silu激活函數,C3包括兩個2D卷積層和一個瓶頸層,Upsample是上採樣層。 SPPF模組是SPP模組的加速版本,MAB模組如上面提及的所示,其中ECA如左下角所示。在沒有降維的通道層級全域平均池化之後,考慮到每個通道與其k個鄰居的關係,使用大小為k的快速1D卷積來捕獲局部跨通道交互信息,從而有效地執行ECA。上述兩個變換沿著兩個空間方向收集特徵,以產生一對方向感知特徵圖,然後將其連接起來,並使用卷積和Sigmoid函數進行修改,以提供注意力輸出。
04 實驗及視覺化
SIMD資料集是一個多類別、開源、高解析度遙感物件偵測資料集,共包含15個類別,如圖4所示。此外,SIMD資料集更分佈在中小型目標(w
可以將SPPF模組的輸出連接到輸出頭,從而識別影像中的大目標。然而,SPPF模組的輸出具有多個連接,並涉及多個尺度的目標,因此直接將其用於探測頭來識別大型物體將導致較差的模型表示,如上圖所示,顯示了添加MAB模組前後一些檢測結果熱圖的視覺比較。在加入MAB模組後,該檢測頭專注於檢測大目標,而將小目標的預測分配給其他預測頭,提高了模型的表達效果,也更符合YOLO演算法中基於目標大小劃分檢測頭的要求。
有些偵測結果如上圖所示。從各個檢測結果來看,與其他演算法沒有太大差異,但與其他演算法相比,我們研究的演算法在保證時間消耗不顯著增加的同時,提高了模型的檢測效果,並利用注意力機制增強了模型的表達效果。
以上是改進的檢測演算法:用於高解析度光學遙感影像目標檢測的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

i77700的效能運行win11完全足夠,但是用戶卻發現自己的i77700不能升級win11,這主要是受到了微軟硬性條件的限制,所以只要跳過該限制就能安裝了。 i77700不能升級win11:1、因為微軟限制了cpu的版本。 2.intel只有第八代以上版本可以直升win11。3、而i77700作為7代,無法滿足win11的升級需求。 4.但是i77700在性能上是完全能流暢使用win11的。 5.所以大家可以使用本站的win11直裝系統。 6.下載完成後,右鍵「裝載」該檔案。 7.再雙擊運行其中的「一鍵

寫在前面&筆者的個人理解目前,在整個自動駕駛系統當中,感知模組扮演了其中至關重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後,才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息,用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結果能便捷地應用於各種下游任務,因此受到工業

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統,用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測:基礎知識CrimeGPT利用機器學習演算法來分析大量資料集,識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢,人工智慧可以為執法機構

C++sort函數底層採用歸併排序,其複雜度為O(nlogn),並提供不同的排序演算法選擇,包括快速排序、堆排序和穩定排序。

今天要為大家介紹一篇MIT上週發表的文章,使用GPT-3.5-turbo解決時間序列異常檢測問題,初步驗證了LLM在時間序列異常檢測的有效性。整個過程沒有進行finetune,直接使用GPT-3.5-turbo進行異常檢測,文中的核心是如何將時間序列轉換成GPT-3.5-turbo可辨識的輸入,以及如何設計prompt或pipeline讓LLM解決異常檢測任務。下面跟大家詳細介紹一下這篇工作。圖片論文標題:Largelanguagemodelscanbezero-shotanomalydete

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像
