현재 탐지 효율성과 탐지 결과 사이의 적절한 균형을 맞추기가 어렵습니다. 우리는 광학 원격 탐사 이미지에서 표적 감지 네트워크의 효과를 향상시키기 위해 다층 특징 피라미드, 다중 감지 헤드 전략 및 하이브리드 주의 모듈을 사용하여 고해상도 광학 원격 감지 이미지에서 표적 감지를 위한 향상된 YOLOv5 알고리즘을 개발했습니다. SIMD 데이터 세트에 따르면 새로운 알고리즘의 mAP는 YOLOv5보다 2.2%, YOLOX보다 8.48% 우수하여 탐지 결과와 속도 간의 균형이 더 잘 이루어졌습니다.
원격탐사 기술의 급속한 발전으로 항공기, 자동차, 건물 등 지구 표면의 많은 물체를 묘사하기 위해 고해상도 광학 원격탐사 영상이 활용되고 있습니다. 객체 감지는 원격 탐사 이미지를 해석하는 데 중요한 역할을 하며 원격 탐사 이미지의 분할, 설명 및 대상 추적에 사용될 수 있습니다. 그러나 상대적으로 넓은 시야와 높은 고도의 필요성으로 인해 항공 광학 원격 탐사 이미지는 규모, 시점 특이성, 무작위 방향 및 높은 배경 복잡성의 다양성을 나타내는 반면 대부분의 기존 데이터 세트에는 지상 뷰가 포함되어 있습니다. 결과적으로 인공 특징 탐지를 구성하는 데 사용되는 기술은 전통적으로 정확도와 속도에서 큰 차이를 기록해 왔습니다. 사회의 요구와 딥러닝 개발 지원으로 인해 광학 원격탐사 영상에서 표적 탐지를 위한 신경망의 활용이 필요합니다.
현재 광학 원격탐사 사진을 분석하기 위해 딥러닝을 결합한 표적 탐지 알고리즘은 감독형, 비지도형, 약한 감독형의 세 가지 유형으로 나눌 수 있습니다. 그러나 비지도 알고리즘과 약한 지도 알고리즘의 복잡성과 불확실성으로 인해 지도 알고리즘이 가장 일반적으로 사용되는 알고리즘입니다. 또한 감독 객체 감지 알고리즘은 단일 단계 또는 2단계로 나눌 수 있습니다. 항공기는 주로 공항에 위치하고 선박은 주로 항구와 바다에 위치한다는 가정을 바탕으로, 다운샘플링된 별 이미지에서 공항과 항구를 탐지한 후, 발견된 물체를 다시 원본 초고해상도 위성 이미지로 매핑하여 탐지할 수 있습니다. 크기가 다른 물체를 동시에. 일부 연구자들은 목표 방향의 무작위화 문제를 해결하여 원격탐사 영상에서 목표물 탐지의 정확도를 향상시키는 RCNN 기반의 회전 목표물 탐지 방법을 제안한 바 있다.
현재 YOLO 시리즈 감지 헤드의 대부분은 FPN 및 PAFPN의 출력 특성을 기반으로 하며 그 중 YOLOv3와 같은 FPN 기반 네트워크와 그 변형이 그림에 나와 있습니다. 아래 a. 단방향 융합 기능을 직접 활용하여 출력합니다. PAFPN 알고리즘을 기반으로 하는 YOLOv4와 YOLOv5는 이를 기반으로 하위 레벨과 상위 레벨 채널을 추가하여 하위 레벨 신호를 직접 상향 전송합니다(아래 b).
위 그림과 같이 일부 연구에서는 TPH-YOLOv5 모델에 특정 감지 작업을 위해 감지 헤드가 추가되었습니다. 위의 그림 b와 c에서는 PAFPN 기능만 출력으로 사용할 수 있고 FPN 기능은 완전히 활용되지 않습니다. 따라서 YOLOv7은 위의 그림 d에 표시된 것처럼 3개의 보조 헤드를 FPN 출력에 연결하지만 보조 헤드는 "대략적인 선택"에만 사용되며 무게 평가가 더 낮습니다. SSD의 검출 헤드는 YOLO 네트워크의 너무 거친 앵커 세트 설계를 개선하기 위해 제안되었으며, 멀티 스케일을 기반으로 조밀한 앵커 설계 구성을 제안합니다. 그림 f에서 볼 수 있듯이 이 전략은 PANet과 FPN의 기능 정보를 동시에 활용할 수 있습니다. 또한 출력을 직접 추가하는 64x 다운샘플링 프로세스가 있어 네트워크에 이전 전역 정보가 포함됩니다.
다중 감지 헤드 방식은 네트워크의 출력 기능을 효과적으로 활용할 수 있습니다. 향상된 YOLO는 고해상도 원격 감지 사진을 위한 객체 감지 네트워크입니다. 아래 그림과 같이:
백본 네트워크의 기본 구조는 C3 및 컨볼루션 모듈을 핵심으로 하는 CSP 밀집 네트워크입니다. 데이터 증대 후 이미지가 네트워크에 공급되고 커널 크기 6의 Conv 모듈에 의한 채널 혼합 후 많은 컨벌루션 모듈이 기능 검색을 수행합니다. SPPF라는 기능 강화 모듈 이후에는 Neck의 PANet에 연결됩니다. 네트워크의 탐지 능력을 향상시키기 위해 양방향 특징 융합이 수행됩니다. Conv2d는 융합된 피처 레이어를 독립적으로 확장하여 다중 레이어 출력을 생성하는 데 사용됩니다. 아래 그림에서 볼 수 있듯이 NMS 알고리즘은 모든 단일 레이어 감지기의 출력을 결합하여 최종 감지 프레임을 생성합니다.
아래 그림 b는 개선된 YOLO 네트워크의 각 모듈의 구조적 구성을 설명합니다.
Conv에는 2D 컨볼루션 레이어, BN 레이어 일괄 정규화 및 Silu 활성화 기능이 포함되어 있고, C3에는 2개의 2D 컨볼루션 레이어와 병목 현상 레이어가 포함되어 있으며, Upsample은 업샘플링 레이어입니다. SPPF 모듈은 SPP 모듈의 가속 버전이며 MAB 모듈은 위에서 언급한 바와 같고 ECA는 왼쪽 하단에 표시된 것과 같습니다. 차원 축소 없이 채널 수준 전역 평균 풀링 후 k 크기의 빠른 1D 컨볼루션을 사용하여 각 채널과 k 이웃 간의 관계를 고려하여 로컬 교차 채널 상호 작용 정보를 캡처함으로써 효율적으로 ECA를 수행합니다. 위의 두 가지 변환은 두 공간 방향을 따라 특징을 수집하여 한 쌍의 방향 인식 특징 맵을 생성한 다음 컨볼루션 및 시그모이드 함수를 사용하여 연결하고 수정하여 주의 출력을 제공합니다.
SIMD 데이터 세트는 그림 4와 같이 총 15개 카테고리를 포함하는 다중 카테고리, 오픈 소스, 고해상도 원격 감지 물체 탐지 데이터 세트입니다. 또한 SIMD 데이터 세트는 중소형 타겟(w
SPPF 모듈의 출력을 출력 헤더에 연결하여 이미지에서 큰 대상을 식별할 수 있습니다. 그러나 SPPF 모듈의 출력에는 여러 연결이 있고 여러 규모의 대상이 포함되므로 감지 헤드에 직접 사용하여 대형 물체를 식별하면 위 그림과 같이 추가 전후를 보여주는 모델 표현이 좋지 않습니다. MAB 모듈 일부 탐지 결과의 히트맵을 시각적으로 비교합니다. MAB 모듈을 추가한 후 탐지 헤드는 큰 표적 탐지에 초점을 맞추고 작은 표적의 예측을 다른 예측 헤드에 할당합니다. 이는 모델의 표현 효과를 향상시키고 표적을 기준으로 탐지 헤드를 나누는 요구 사항에 더 부합합니다. YOLO 알고리즘의 크기.
일부 테스트 결과는 위 사진에 나와 있습니다. 각각의 탐지 결과로 볼 때 다른 알고리즘과 큰 차이는 없지만, 우리가 연구한 알고리즘은 시간 소모가 크게 증가하지 않도록 하면서 모델의 탐지 효과를 향상시키며, Attention 메커니즘을 사용합니다. 모델의 표현 효과를 향상시킵니다.
위 내용은 탐지 알고리즘 개선: 고해상도 광학 원격탐사 이미지에서 표적 탐지용의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!