목차
VFA 모델 세부 정보
결론
기술 주변기기 일체 포함 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

Apr 12, 2023 pm 06:46 PM
발각 목표

기존 객체 감지 문제와 달리 FSOD(Few-Shot 객체 감지)는 기본 클래스 샘플이 많지만 새로운 클래스 샘플의 수가 적다고 가정합니다. 기본 클래스에서 새로운 클래스로 지식을 전달하는 방법을 연구하여 새로운 클래스를 인식하는 탐지기의 능력을 향상시키는 것이 목표입니다.

FSOD는 일반적으로 2단계 교육 패러다임 을 따릅니다. 첫 번째 단계에서 감지기는 풍부한 기본 클래스 샘플을 사용하여 학습되어 객체 위치 파악 및 분류와 같은 객체 감지 작업에 필요한 일반적인 표현을 학습합니다. 두 번째 단계에서는 검출기가 소수의 새로운 클래스 샘플(예: 1, 2, 3...)만을 사용하여 미세 조정됩니다. 그러나 기본 클래스와 신규 클래스 샘플 수의 불균형으로 인해 학습된 모델은 일반적으로 기본 클래스 쪽으로 편향되어 유사한 기본 클래스와 신규 클래스 대상을 혼동하게 됩니다. 더욱이, 각 신규 클래스에 대한 샘플이 소수이기 때문에 모델은 신규 클래스의 분산에 민감합니다. 예를 들어, 여러 훈련을 위해 새로운 클래스 샘플을 무작위로 샘플링하는 경우 결과는 매번 상당히 다를 것입니다. 따라서 작은 표본에서 모델의 견고성을 향상시키는 것이 매우 필요합니다.

최근 Tencent Youtu Lab과 우한 대학교는 Variational Feature Aggregation을 기반으로 하는 소수 샘플 대상 탐지 모델 VFA를 제안했습니다. VFA의 전체 구조는 메타 학습 대상 탐지 프레임워크 Meta R-CNN++의 향상된 버전을 기반으로 하며 Class-Agnostic Aggregation CAA(Class-Agnostic Aggregation) 의 두 가지 기능 집계 방법이 제안됩니다. Variational Feature Aggregation VFA(Variational Feature Aggregation).

기능 집계는 쿼리와 지원 샘플 간의 상호 작용을 정의하는 FSOD의 핵심 설계입니다. Meta R-CNN과 같은 이전 방법은 일반적으로 CSA(클래스별 집계), 즉 기능 집계를 위한 유사한 쿼리 및 지원 샘플의 기능을 사용합니다. 대조적으로, 본 논문에서 제안하는 CAA는 서로 다른 클래스의 샘플 간의 기능 집계를 허용합니다. CAA는 모델이 클래스 독립적 표현을 학습하도록 권장하므로 기본 클래스에 대한 모델의 편향을 줄입니다. 또한 서로 다른 클래스 간의 상호 작용을 통해 클래스 간의 관계를 더 잘 모델링할 수 있으므로 클래스 혼란을 줄일 수 있습니다.

본 논문에서는 CAA를 기반으로 VAE(Variational Encoder)를 사용하여 Support 샘플을 클래스 분포로 인코딩하고, 학습된 분포에서 새로운 Support 기능을 샘플링하여 기능 융합을 수행하는 VFA를 제안합니다. 관련 연구[1]에서는 클래스 내 분산(예: 외양의 변화)이 클래스 전체에서 유사하며 공통 분포로 모델링될 수 있다고 명시합니다. 따라서 기본 클래스의 분포를 사용하여 새로운 클래스의 분포를 추정할 수 있으므로 샘플 수가 적은 경우 특징 집계의 견고성을 향상시킬 수 있습니다.

VFA는 여러 FSOD 데이터 세트에서 현재 최고의 모델보다 더 나은 성능을 발휘합니다. 관련 연구는 AAAI 2023에서 Oral으로 승인되었습니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

문서 주소: https://arxiv.org/abs/2301.13411

VFA 모델 세부 정보

강력한 기준 방법: Meta R-CNN++

현재 FSOD 작업은 크게 메타러닝 기반 방법과 Fine-tuning 기반 방법 두 가지로 나눌 수 있습니다. 일부 초기 연구에서는 메타 학습이 FSOD에 효과적이라는 것이 입증되었지만 최근 미세 조정 기반 방법이 주목을 받고 있습니다. 이 논문은 먼저 메타 학습을 기반으로 하는 기본 방법인 Meta R-CNN++를 확립하여 두 방법 간의 격차를 줄이고 일부 지표에서는 미세 조정 기반 방법을 능가합니다.

메타 학습 방법인 Meta R-CNN [2]과 미세 조정 기반 방법인 TFA [3]를 예로 들어 두 방법 간의 구현 차이를 먼저 분석했습니다. -단계 훈련 패러다임, TFA는 미세 조정 단계에서 추가 기술을 사용하여 모델을 최적화합니다.

  1. TFA는 대부분의 네트워크 매개변수를 동결하고 모델이 소수 범주에 과적합되지 않도록 최종 분류 및 회귀 계층만 훈련합니다.
  2. 분류 레이어를 무작위로 초기화하는 대신 TFA는 기본 클래스의 사전 훈련된 가중치를 복사하고 신규 클래스의 가중치만 초기화합니다.
  3. TFA는 선형 분류기 대신 코사인 분류기를 사용합니다.

TFA의 성공을 고려하여 Meta R-CNN++을 구축했습니다. 아래 표 1에서 볼 수 있듯이, 메타러닝 방법 역시 미세 조정 단계를 주의 깊게 처리하면 좋은 결과를 얻을 수 있습니다. 따라서 본 논문에서는 Meta R-CNN++를 기본 방법으로 선택합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

표 1: Meta R-CNN과 TFA

범주 독립적 기능 집계 CAA


비교 및 ​​분석

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

사진 1 : 카테고리 독립적인 특징 집계 CAA

의 개략도 이 글은 간단하고 효과적인 카테고리 독립적 특징 집계 방법 CAA을 제안합니다. 위의 그림 1에서 볼 수 있듯이 CAA는 서로 다른 클래스 간의 기능 집계를 허용하여 모델이 클래스 독립적인 표현을 학습하도록 장려하여 클래스 간 편향과 클래스 간의 혼란을 줄입니다. 특히 클래스 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지의 각 RoI 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지과 지원 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지, 에 대해 클래스 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지의 지원 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지을 무작위로 선택하여 쿼리 기능으로 집계합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

그런 다음 집계된 특징

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

을 감지 하위 네트워크

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

에 공급하여 분류 점수 를 출력합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지.

변형 특징 집계 VFA

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

그림 2 VFA 모델 회로도

일반적으로 인코딩된 이전 작업 샘플을 단일 특징 벡터로 지원하여 카테고리의 중심을 나타냅니다. 그러나 표본이 작고 분산이 큰 경우 클래스 중심을 정확하게 추정하기가 어렵습니다. 이 문서에서는 먼저 지원 기능을 클래스에 대한 분포로 변환합니다. 추정된 클래스 분포는 특정 샘플에 편향되지 않으므로 분포에서 샘플링된 특징은 샘플의 분산에 상대적으로 견고합니다. VFA의 프레임워크는 위의 그림 2에 나와 있습니다.

a) 변형 특성 학습. VFA는 카테고리 분포를 학습하기 위해 변형 자동 인코더 VAE[4]를 사용합니다. 그림 2에 표시된 것처럼 지원 기능 S의 경우 먼저 인코더 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지를 사용하여 분포 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지의 모수를 추정한 다음 변형 추론 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지을 통해 분포 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지에서 샘플링합니다. , 그리고 마지막으로 재구성된 지원 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지은 디코더 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지을 통해 획득됩니다. VAE를 최적화할 때 일반적인 KL Loss회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지 및 재구성 Loss회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지 외에도 이 기사에서는 일관성 손실을 사용하여 학습된 분포가 카테고리 정보를 유지하도록 합니다.​

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

b) 변형 기능 융합. 지원 기능은 카테고리에 대한 분포로 변환되므로 분포에서 기능을 샘플링하고 쿼리 기능으로 집계할 수 있습니다. 특히 VFA는 클래스 독립적 집계 CAA도 사용하지만 쿼리 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지과 변형 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지을 함께 집계합니다. 클래스 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지의 쿼리 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지과 클래스 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지의 지원 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

을 고려하여 먼저 분포 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지를 추정하고 변형 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지을 샘플링한 후 다음 공식을 사용하여 융합합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

여기서 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지은 채널 곱셈을 나타내고, sig는 시그모이드 연산의 약어입니다. 훈련 단계에서는 집계를 위해 지원 기능 을 무작위로 선택합니다. 테스트 단계에서는 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

클래스의 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지 지원 기능 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지을 평균화하고 분포 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지를 추정합니다. 여기서 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지 . ​

분류 - 회귀 작업 분리

일반적으로 감지 하위 네트워크 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지는 공유 기능 추출기 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지와 두 개의 독립 네트워크인 분류 하위 네트워크 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지와 회귀 하위 네트워크 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지로 구성됩니다. 이전 작업에서는 집계된 특징이 객체 분류 및 경계 상자 회귀를 위한 감지 하위 네트워크에 입력되었습니다. 그러나 분류 작업에는 번역 불변 기능이 필요하고 회귀에는 번역 공변 기능이 필요합니다. 지원 기능은 범주의 중심을 나타내고 변환 불변이므로 집계된 기능은 회귀 작업에 해를 끼칩니다.

이 기사에서는 간단한 분류-회귀 작업 분리를 제안합니다. 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지은 원본 및 집계된 쿼리 기능을 나타냅니다. 이전 방법에서는 두 작업 모두에 대해 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지를 채택했습니다. 여기서 분류 점수 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지 및 예측 경계 상자 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지는 다음과 같이 정의됩니다.

이러한 작업을 분리하기 위해 별도의 기능 추출기를 채택하고 경계 상자 회귀에 원래 지원 기능회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

을 사용합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

실험 평가회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

데이터 세트 채택:

파스칼 VOC, MS COCO.

평가 지표: 소설급 평균 정밀도 nAP, 기본급 평균 정밀도 bAP. 주요 결과

VFA는 두 데이터세트 모두에서 더 나은 결과를 얻었습니다. 예를 들어, PASCAL VOC 데이터 세트(아래 표 2)에서 VFA는 이전 방법보다 훨씬 높습니다. VFA의 1회 결과는 일부 방법의 10회 결과보다 훨씬 높습니다.

표 2 PASCAL VOC 데이터 세트에 대한 VFA의 효과 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

절제 실험

a) 다양한 모듈의 역할. 아래 표 3에 표시된 것처럼 VFA의 다양한 모듈이 함께 작동하여 모델 성능을 향상시킬 수 있습니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

표 3 다양한 모듈의 역할

b) 다양한 기능 집계 방법의 시각적 분석 . 아래 그림 3에서 볼 수 있듯이 CAA는 기본 클래스와 새로운 클래스 간의 혼동을 줄일 수 있으며 VFA는 CAA 기반 클래스 간의 구분을 더욱 강화합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

그림 3 유사성 행렬 시각화

c) 보다 정확한 범주 중심점 추정 . 아래 그림 4에서 볼 수 있듯이 VFA는 카테고리의 중심을 더 정확하게 추정할 수 있습니다. 그리고 표본 수가 줄어들수록 추정의 정확도는 기준선 방법보다 점차 높아집니다. 이는 또한 샘플 수가 적을 때(K=1) 우리 방법이 더 잘 수행되는 이유를 설명합니다.

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

그림 4 추정된 카테고리 중심과 실제 카테고리 중심 사이의 거리

d) 결과 시각화 .

회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지

그림 5 시각화 결과

결론

본 논문은 메타러닝을 기반으로 한 FSOD의 기능 집계 방법으로 돌아가서 카테고리 독립적인 기능 집계 CAA 및 변형을 제안합니다. 알 기능 집계 VFA. CAA는 기본 클래스와 신규 클래스 간의 클래스 편향과 혼란을 줄일 수 있습니다. VFA는 샘플을 클래스 분포로 변환하여 보다 강력한 기능 집계를 달성합니다. PASCAL VOC 및 MS COCO 데이터 세트에 대한 실험은 본 논문에서 제안한 방법의 효율성을 보여줍니다.

위 내용은 회귀 메타 학습, 새로운 SOTA 달성을 위한 변형 특징 집합 기반의 소수 샘플 대상 탐지의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Windows 11로 업그레이드할 수 없는 i7-7700에 대한 솔루션 Windows 11로 업그레이드할 수 없는 i7-7700에 대한 솔루션 Dec 26, 2023 pm 06:52 PM

i77700의 성능은 win11을 실행하기에 충분하지만 사용자는 i77700을 win11로 업그레이드할 수 없다는 것을 알게 됩니다. 이는 주로 Microsoft에서 부과한 제한 사항 때문이므로 이 제한 사항을 건너뛰는 한 설치할 수 있습니다. i77700은 win11로 업그레이드할 수 없습니다. 1. Microsoft에서는 CPU 버전을 제한하기 때문입니다. 2. Intel의 8세대 이상 버전만 win11로 직접 업그레이드할 수 있습니다. 3. 7세대인 i77700은 win11의 업그레이드 요구 사항을 충족할 수 없습니다. 4. 하지만 i77700은 성능면에서 win11을 완벽하게 원활하게 사용할 수 있습니다. 5. 따라서 이 사이트의 win11 직접 설치 시스템을 사용할 수 있습니다. 6. 다운로드가 완료되면 파일을 마우스 오른쪽 버튼으로 클릭하고 "로드"합니다. 7. 더블클릭하여 "원클릭"을 실행합니다.

낙상 감지, 골격점 인간 행동 인식을 기반으로 코드의 일부가 Chatgpt로 완성됨 낙상 감지, 골격점 인간 행동 인식을 기반으로 코드의 일부가 Chatgpt로 완성됨 Apr 12, 2023 am 08:19 AM

여러분, 안녕하세요. 오늘 저는 넘어짐 감지 프로젝트를 여러분과 공유하고 싶습니다. 정확하게는 골격점을 기반으로 한 인간의 움직임 인식입니다. 이는 대략 3단계로 나뉩니다: 인체 인식, 인체 골격 지점 동작 분류 프로젝트 소스 코드가 패키지되어 있습니다. 획득 방법은 기사 끝부분을 참조하세요. 0. chatgpt 먼저 모니터링되는 비디오 스트림을 가져와야 합니다. 이 코드는 상대적으로 고정되어 있습니다. chatgpt가 작성한 코드를 chatgpt가 직접 완성하도록 할 수 있으며 문제가 없으며 직접 사용할 수 있습니다. 그러나 나중에 mediapipe를 사용하여 인간의 뼈대 지점을 식별하는 등의 비즈니스 작업에 관해서는 chatgpt에서 제공하는 코드가 올바르지 않습니다. 나는 chatgpt를 비즈니스 로직과 독립적인 도구 상자로 사용할 수 있다고 생각합니다. 이를 C에 넘겨볼 수 있습니다.

MIT의 최신 걸작: GPT-3.5를 사용하여 시계열 이상 탐지 문제 해결 MIT의 최신 걸작: GPT-3.5를 사용하여 시계열 이상 탐지 문제 해결 Jun 08, 2024 pm 06:09 PM

오늘은 지난 주 MIT에서 발표한 기사를 소개하고자 합니다. GPT-3.5-turbo를 사용하여 시계열 이상 탐지 문제를 해결하고, 시계열 이상 탐지에서 LLM의 효율성을 초기에 검증한 내용입니다. 전체 과정에 미세한 조정은 없으며, 이상 탐지를 위해 GPT-3.5-turbo를 직접 사용하는 것이 이 글의 핵심이다. LLM이 이상 탐지 작업을 해결하도록 하는 프롬프트 또는 파이프라인입니다. 이 작품을 자세히 소개하겠습니다. 이미지 논문 제목: Large Languagemodelscanbezero-shotanomalydete

탐지 알고리즘 개선: 고해상도 광학 원격탐사 이미지에서 표적 탐지용 탐지 알고리즘 개선: 고해상도 광학 원격탐사 이미지에서 표적 탐지용 Jun 06, 2024 pm 12:33 PM

01 전망 요약 현재로서는 탐지 효율성과 탐지 결과 간의 적절한 균형을 이루기가 어렵습니다. 우리는 광학 원격 탐사 이미지에서 표적 감지 네트워크의 효과를 향상시키기 위해 다층 특징 피라미드, 다중 감지 헤드 전략 및 하이브리드 주의 모듈을 사용하여 고해상도 광학 원격 감지 이미지에서 표적 감지를 위한 향상된 YOLOv5 알고리즘을 개발했습니다. SIMD 데이터 세트에 따르면 새로운 알고리즘의 mAP는 YOLOv5보다 2.2%, YOLOX보다 8.48% 우수하여 탐지 결과와 속도 간의 균형이 더 잘 이루어졌습니다. 02 배경 및 동기 원격탐사 기술의 급속한 발전으로 항공기, 자동차, 건물 등 지구 표면의 많은 물체를 묘사하기 위해 고해상도 광학 원격탐사 영상이 활용되고 있다. 원격탐사 이미지 해석에서 물체 감지

실시간으로 SOTA를 추가하고 급상승하세요! FastOcc: 더 빠른 추론 및 배포 친화적인 Occ 알고리즘이 출시되었습니다! 실시간으로 SOTA를 추가하고 급상승하세요! FastOcc: 더 빠른 추론 및 배포 친화적인 Occ 알고리즘이 출시되었습니다! Mar 14, 2024 pm 11:50 PM

위에 쓴 글 & 저자의 개인적인 이해는 자율주행 시스템에서 인지 작업은 전체 자율주행 시스템의 중요한 구성 요소라는 것입니다. 인지 작업의 주요 목표는 자율주행차가 도로를 주행하는 차량, 길가의 보행자, 주행 중 직면하는 장애물, 도로 위의 교통 표지판 등 주변 환경 요소를 이해하고 인지하여 하류에 도움을 주는 것입니다. 모듈 정확하고 합리적인 결정과 행동을 취하십시오. 자율주행 기능을 갖춘 차량에는 일반적으로 자율주행 차량이 정확하게 인식하고 인식할 수 있도록 서라운드 뷰 카메라 센서, 라이더 센서, 밀리미터파 레이더 센서 등과 같은 다양한 유형의 정보 수집 센서가 장착됩니다. 주변 환경 요소를 이해하여 자율 주행 중에 자율 차량이 올바른 결정을 내릴 수 있도록 합니다. 머리

PHP 언어 개발에서 null 값 오류를 감지하고 처리하는 방법은 무엇입니까? PHP 언어 개발에서 null 값 오류를 감지하고 처리하는 방법은 무엇입니까? Jun 11, 2023 am 10:51 AM

최신 웹 애플리케이션의 지속적인 개발로 인해 가장 널리 사용되는 프로그래밍 언어 중 하나인 PHP는 웹 사이트 개발에 널리 사용됩니다. 그러나 개발 프로세스 중에 null 값 오류가 자주 발생하며 이러한 오류로 인해 애플리케이션에서 예외가 발생하여 사용자 경험에 영향을 미칠 수 있습니다. 따라서 PHP 개발 과정에서 null 오류를 감지하고 처리하는 방법은 프로그래머가 숙달해야 할 중요한 기술입니다. 1. 널값 오류란 무엇입니까? PHP 개발 프로세스에서 널값 오류는 일반적으로 초기화되지 않은 변수와 변수 변수라는 두 가지 상황을 나타냅니다.

AAAI2024: Far3D - 150m 시각적 3D 표적 탐지에 직접 도달하는 혁신적인 아이디어 AAAI2024: Far3D - 150m 시각적 3D 표적 탐지에 직접 도달하는 혁신적인 아이디어 Dec 15, 2023 pm 01:54 PM

최근 Arxiv에서 순수 시각적 서라운드 인식에 관한 최신 연구를 읽었습니다. 이 연구는 PETR 시리즈 방법을 기반으로 하며 장거리 표적 탐지의 순수 시각적 인식 문제를 해결하여 인식 범위를 150미터로 확장하는 데 중점을 둡니다. 본 논문의 방법과 결과는 우리에게 큰 참고가치가 있어 이를 해석해 보았습니다. 원제: Far3D: Expanding the Horizon for Surround-view3DObjectDetection 논문 링크: https://arxiv.org/abs/2308.09616 저자 소속 :Beijing Institute of Technology & Megvii Technology 과제 배경 자율주행 이해에 있어서 3D 객체 검출

LiDAR-밀리미터파 레이더-시각적 기능을 효과적으로 상호 연관시키기 위해 변환기를 사용하는 방법은 무엇입니까? LiDAR-밀리미터파 레이더-시각적 기능을 효과적으로 상호 연관시키기 위해 변환기를 사용하는 방법은 무엇입니까? Apr 19, 2024 pm 04:01 PM

저자가 자율주행에 대해 개인적으로 이해하기 위한 기본적인 작업 중 하나는 3차원 표적 탐지이며, 현재는 다중 센서 융합을 기반으로 많은 방법이 구현되고 있다. 그렇다면 다중 센서 융합이 필요한 이유는 무엇입니까? 라이더와 카메라 융합이든, 밀리미터파 레이더와 카메라 융합이든, 주요 목적은 포인트 클라우드와 이미지 간의 상호 보완적인 연결을 사용하여 표적 탐지의 정확도를 높이는 것입니다. 컴퓨터 비전 분야에서 Transformer 아키텍처가 지속적으로 적용됨에 따라 주의 메커니즘 기반 방법은 여러 센서 간의 융합 정확도를 향상시켰습니다. 공유된 두 논문은 이러한 아키텍처를 기반으로 하며 각 양식의 유용한 정보를 더 많이 활용하고 더 나은 융합을 달성하기 위한 새로운 융합 방법을 제안합니다. TransFusion: 주요 기여

See all articles