논문 주소: YOLOCS: ObjectDetection based on Dense Channel Compression for Feature Spatial Solidification (arxiv.org)
오늘 공유에서 연구자는 특징 정화와 그라데이션의 특징을 조사했습니다. 네트워크 내 순방향 및 역방향 전파에 중점을 두고 역전파 중 채널 특성과 컨볼루션 커널 간의 상관관계를 알아봅니다. 이에 연구진은 밀집채널 압축(Dense Channel Compression)이라는 특징 공간 응고법을 제안했다. 이 방법의 핵심 개념을 기반으로 백본 및 헤드 네트워크를 위한 두 가지 혁신적인 모듈, 즉 기능 공간 강화를 위한 DCFS(밀집 채널 압축)와 비대칭 다중 레벨 압축 분리 헤드(ADH)가 도입되었습니다. YOLOv5 모델에 통합되었을 때 이 두 모듈은 뛰어난 성능을 보여 YOLOCS라는 향상된 모델을 탄생시켰습니다.
MSCOCO 데이터 세트로 평가한 결과, 대형, 중형, 소형 YOLOCS 모델의 AP는 각각 50.1%, 47.6%, 42.5%입니다. YOLOv5 모델과 유사한 추론 속도를 유지하면서 대형, 중형, 소형 YOLOCS 모델은 YOLOv5의 AP에 비해 각각 1.1%, 2.3%, 5.2%의 이점을 달성했습니다.
최근 몇 년 동안 컴퓨터 비전 분야에서 객체 감지 기술이 폭넓은 주목을 받아왔습니다. 그 중 Single Shot Multi-Box 알고리즘을 기반으로 한 표적 탐지 기술(Single Shot Multi Box Detector, SSD로 지칭)과 컨볼루션 신경망(Convolutional Neural Networks, CNN으로 지칭) 기반 표적 탐지 기술이 있다. 가장 일반적으로 사용되는 두 가지 표적 탐지 기술. 그러나 싱글샷 다중 프레임 알고리즘의 낮은 정확도와 컨볼루션 신경망 기반 표적 탐지 기술의 높은 계산 복잡도로 인해 효율적이고 고정밀 표적 탐지 기술을 찾는 것이 현재 연구의 핵심이 되고 있습니다. 하나.
DCC(Dense Channel Compression)는 컨벌루션 신경망의 특징 맵을 공간적으로 굳혀 네트워크 매개변수의 압축 및 가속을 달성하는 새로운 컨벌루션 신경망 압축 기술입니다. 그러나 표적 탐지 분야에 DCC 기술을 적용하는 것은 충분히 연구되지 않았습니다. DCC(Dense Channel Compression) 기술은 네트워크 매개변수 수를 줄여 계산 효율성을 향상시키는 것을 목표로 합니다. 구체적으로 DCC는 컨벌루션 계층의 출력 특징 맵에 대해 채널 압축을 수행하여 컨벌루션 계층의 매개변수 수를 줄입니다. 이 압축 기술은 중복되고 불필요한 채널을 제거하거나 낮은 순위 분해와 같은 방법을 사용하여 달성할 수 있습니다. DCC 기술은 영상 분류 작업에 매우 효과적이므로 Dense Channel Compression을 기반으로 한 표적 탐지 기술인 YOLOCS(YOLO with Dense Channel Compression)가 제안됩니다. YOLOCS 기술은 DCC 기술과 YOLO(You Only Look Once) 알고리즘을 결합하여 표적 탐지의 효율적이고 고정밀 처리를 달성합니다. 특히 YOLOCS 기술은 DCC 기술을 사용하여 특징 맵을 공간적으로 강화함으로써 대상 위치의 정확한 위치 지정을 달성하는 동시에 YOLO 알고리즘의 단일 샷 다중 프레임 알고리즘 특성을 사용하여 대상 분류를 빠르게 수행합니다. 계산.
03 New Framework
특징 공간 응고 구조(DCFS)를 위한 고밀도 채널 압축
또한 각 레이어의 압축된 기능에는 더 큰 컨볼루션 커널 가중치(3×3)가 제공되어 출력 기능의 수용 필드를 효과적으로 확장합니다. 이러한 접근 방식을 특징 공간 강화 밀집 채널 압축이라고 합니다. 기능 공간 강화를 위한 고밀도 채널 압축의 근거는 채널 압축을 용이하게 하기 위해 더 큰 컨볼루션 커널을 활용하는 것입니다. 이 기술에는 두 가지 주요 장점이 있습니다. 첫째, 순방향 전파 중에 기능 인식의 수용 필드를 확장하여 지역적으로 관련된 기능 세부 정보가 통합되어 압축 단계 전체에서 기능 손실을 최소화합니다. 둘째, 오류 역전파 시 오류 세부 정보가 향상되어 보다 정확한 가중치 조정이 가능해졌습니다.
이 두 가지 장점을 더 자세히 설명하기 위해 아래와 같이 두 개의 서로 다른 커널 유형(1×1 및 3×3)이 있는 컨볼루션을 사용하여 두 채널을 압축합니다.
네트워크 구조는 다음과 같습니다. 아래 그림에서. 네트워크의 순방향 전파 과정에서 채널을 점진적으로 압축하기 위해 3계층 병목 구조가 채택되었습니다. 모든 분기에 절반 채널 3×3 컨볼루션이 적용되고 BN(배치 정규화) 및 활성화 함수 레이어가 적용됩니다. 그 후, 1×1 컨벌루션 레이어를 사용하여 출력 특징 채널을 입력 특징 채널과 일치하도록 압축합니다. symmetric 다중 레벨 채널 압축 헤드 (ADH)는 yolox 모델에서 분리 된 헤드 문제를 해결하기위한 순서로, 연구원들은 일련의 일련을 수행했습니다. 연구와 실험. 결과는 분리된 헤드 구조의 활용과 관련 손실 함수 간의 논리적 상관관계를 보여줍니다. 특히 다양한 작업의 경우 손실 계산의 복잡성에 따라 디커플링 헤드의 구조를 조정해야 합니다. 또한, 분리된 헤드 구조를 다양한 작업에 적용할 때, 이전 레이어의 특징 채널(아래 참조)을 작업 채널로 직접 압축하면 최종 출력 크기의 차이로 인해 상당한 특징 손실이 발생할 수 있습니다. 이는 결과적으로 모델의 전반적인 성능에 부정적인 영향을 미칠 수 있습니다.
MS-COCO val2017에 대한 절제 실험
MS-COCO 2017의 AP 측면에서 YOLOCS, YOLOX 및 YOLOv5-r6.1[7] 비교 test-dev
위 내용은 YoloCS: 기능 맵의 공간 복잡성을 효과적으로 줄입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!