BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.-일체 포함-php.cn

앞서 작성 및 저자 개인적 이해

주요 기여

모델 아키텍처

BEV 공간의 센서 융합

추적 모듈 아키텍처

실험 및 결과

제한 모델

객체 감지 결과

결론

집

기술 주변기기

일체 포함

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

PHPz

Apr 24, 2024 pm 06:07 PM

레이더 3D 검사

앞서 작성 및 저자 개인적 이해

이 글에서는 3차원 표적 탐지 및 다중 표적 추적을 위한 카메라-밀리미터파 레이더 융합 방식(CR3DT)을 소개합니다. LiDAR 기반 방법은 이 분야에 대해 높은 표준을 설정했지만 높은 컴퓨팅 성능과 높은 비용으로 인해 자율 주행 분야에서 이 솔루션의 개발이 제한되었습니다. 비용 상대적으로 저렴하고 많은 학자들의 관심을 끌었지만 결과가 좋지 않았습니다. 따라서 카메라와 밀리미터파 레이더의 융합이 유망한 솔루션이 되고 있습니다. 저자는 기존 카메라 프레임워크인 BEVDet에서 밀리미터파 레이더의 공간 및 속도 정보를 융합하고 이를 CC-3DT++ 추적 헤드와 결합하여 3D 표적 탐지 및 추적의 정확도를 크게 향상시키고 성능과 비용 간의 모순을 무력화합니다.

주요 기여

센서 융합 아키텍처 제안된 CR3DT는 BEV 인코더 전후의 중간 융합 기술을 사용하여 밀리미터파 레이더 데이터를 통합하고 추적을 위해 준밀도 외관 임베딩 헤드를 사용합니다. 밀리미터파 레이더의 속도 추정을 사용한 상관 관계.

감지 성능 평가 CR3DT는 nuScenes 3D 감지 검증 세트에서 mAP 35.1%, NDS(nuScenes 감지 점수) 45.6%를 달성했습니다. 레이더 데이터에 포함된 풍부한 속도 정보를 활용하여 감지기의 평균 속도 오류(mAVE)는 SOTA 카메라 감지기에 비해 45.3% 감소합니다.

추적 성능 평가 CR3DT의 nuScenes 추적 검증 세트에 대한 추적 성능은 38.1% AMOTA로, 카메라 전용 SOTA 추적 모델에 비해 14.9% AMOTA 개선되었으며, 추적기에서 속도 정보를 명시적으로 사용하고 추가 개선이 이루어졌습니다. IDS 수가 약 43% 크게 감소했습니다.

모델 아키텍처

이 방법은 EV-Det 프레임워크를 기반으로 하며 RADAR의 공간 및 속도 정보를 융합하며 향상된 밀리미터파 레이더 탐지기를 명시적으로 사용하는 CC-3DT++ 추적 헤드와 결합됩니다. 데이터 연관을 통해 속도 추정을 통해 궁극적으로 3D 표적 탐지 및 추적이 가능해집니다.

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다. 그림 1 전체 아키텍처. 감지 및 추적은 각각 연한 파란색과 녹색으로 강조 표시됩니다.

BEV 공간의 센서 융합

이 모듈은 내부 집계 및 연결을 포함하여 PointPillars와 유사한 융합 방법을 채택합니다. BEV 그리드는 해상도 0.8의 [-51.2, 51.2]로 설정되어 (128×128) 기능 그리드가 됩니다. 이미지 특징을 BEV 공간에 직접 투영합니다. 각 그리드 유닛의 채널 수는 64이고, 이미지 BEV 특징은 (64×128×128)입니다. 마찬가지로 Radar의 18차원 정보는 각 In에 집계됩니다. 그리드 단위에는 포인트의 x, y 및 z 좌표가 포함되며 레이더 데이터는 향상되지 않습니다. 저자는 레이더 포인트 클라우드가 이미 LiDAR 포인트 클라우드보다 더 많은 정보를 포함하고 있으므로 레이더 BEV 기능은 (18×128×128)임을 확인했습니다. 마지막으로 이미지 BEV 특징(64×128×128)과 Radar BEV 특징(18×128×128)은 BEV 특징 인코딩 계층의 입력으로 ((64+18)×128×128) 직접 연결됩니다. 후속 절제 실험에서는 차원이 (256×128×128)인 BEV 특징 인코딩 계층의 출력에 잔여 연결을 추가하는 것이 유익한 것으로 밝혀졌으며, 그 결과 CenterPoint 감지 헤드의 최종 입력 크기는 ( (256+18)×128×128).

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

그림 2 융합 작업을 위해 BEV 공간에 집계된 레이더 포인트 클라우드 시각화

추적 모듈 아키텍처

추적은 동작 상관 관계와 시각적 특징 유사성을 기반으로 서로 다른 두 프레임의 대상을 연결하는 것입니다. 훈련 과정에서 준밀도 다변량 양성 대비 학습을 통해 1차원 시각적 특징 임베딩 벡터를 얻은 후 CC-3DT의 추적 단계에서 탐지와 특징 임베딩을 동시에 사용합니다. 향상된 CR3DT 위치 감지 및 속도 추정을 활용하도록 데이터 연결 단계(그림 1의 DA 모듈)가 수정되었습니다. 자세한 내용은 다음과 같습니다.

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

실험 및 결과

는 nuScenes 데이터 세트를 기반으로 완료되었으며 모든 학습에서는 CBGS를 사용하지 않았습니다.

제한 모델

작가가 3090 그래픽 카드를 장착한 컴퓨터에서 전체 모델을 진행했기 때문에 제한 모델이라고 합니다. 모델의 타겟 검출 부분은 BEVDet을 검출 기준선으로 사용하고, 영상 인코딩 백본은 ResNet50이며, 영상 입력은 (3×256×704)로 설정되어 있으며, 모델에서는 과거 또는 미래 영상 정보를 사용하지 않는다. 배치 크기는 8로 설정됩니다. 레이더 데이터의 희소성을 완화하기 위해 5번의 스캔을 사용하여 데이터를 향상시킵니다. 융합 모델에는 추가적인 시간 정보가 사용되지 않습니다.

표적 탐지의 경우 mAP, NDS 및 mAVE 점수를 사용하여 추적하고 AMOTA, AMOTP 및 IDS를 사용하여 평가합니다.

객체 감지 결과

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

표 1 nuScenes 검증 세트의 감지 결과

표 1은 카메라만 사용하는 기본 BEVDet(R50) 아키텍처와 비교한 CR3DT의 감지 성능을 보여줍니다. 레이더를 추가하면 탐지 성능이 크게 향상되는 것은 분명합니다. 작은 해상도와 시간 프레임의 제약으로 CR3DT는 카메라 전용 BEVDet에 비해 mAP 5.3% 및 NDS 7.7% 향상을 성공적으로 달성했습니다. 그러나 컴퓨팅 파워의 한계로 인해 고해상도, 시간 정보 병합 등의 실험 결과를 얻지 못했습니다. 또한 추론 시간도 표 1의 마지막 열에 나와 있습니다.

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

표 2 검출 프레임워크의 절제 실험

표 2에서는 다양한 융합 아키텍처가 검출 지표에 미치는 영향을 비교합니다. 여기서 융합 방법은 두 가지 유형으로 나뉩니다. 첫 번째는 논문에서 언급된 것으로, z차원 복셀화 및 후속 3D 컨볼루션을 포기하고 개선된 이미지 특징과 순수 RADAR 데이터를 열로 직접 집계하여 알려진 특징 크기를 얻습니다. 다른 하나는 개선된 이미지 특징과 순수 RADAR 데이터를 0.8 × 0.8 × 0.8m 크기의 큐브로 복셀화하여 대체 특징을 얻는 것입니다. 크기는 ((64+ 18) × 10 × 128 × 128)이므로 BEV 압축기 모듈은 3D 컨볼루션 형태로 사용해야 합니다. 표 2(a)에서 볼 수 있듯이 BEV 압축기의 수가 증가하면 성능이 저하되며 첫 번째 솔루션의 성능이 더 우수함을 알 수 있습니다. 또한 표 2(b)에서 레이더 데이터의 잔여 블록을 추가하면 성능이 향상될 수 있음을 알 수 있으며, 이는 이전 모델 아키텍처에서 언급한 BEV 기능 인코딩 계층의 출력에 잔여 연결을 추가하는 것이 이점임을 확인합니다. .

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다. 표 3 기본 BEVDet 및 CR3DT의 다양한 구성을 기반으로 한 nuScenes 검증 세트의 추적 결과

표 3은 nuScenes 검증 세트에서 개선된 CC3DT++ 추적 모델의 추적 결과를 보여줍니다. CR3DT 탐지 모델의 기준 및 성능. CR3DT 모델은 AMOTA의 성능을 기준 대비 14.9% 향상시키고 AMOTP에서는 0.11m 감소시킵니다. 또한 기준치 대비 IDS가 약 43% 감소한 것을 확인할 수 있다.

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

표 4 CR3DT 감지 백본에서 수행된 추적 아키텍처 절제 실험

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

결론

이 연구는 특히 3D 객체 감지 및 다중 객체 추적을 위한 효율적인 카메라-레이더 융합 모델인 CR3DT를 제안합니다. 레이더 데이터를 카메라 전용 BEVDet 아키텍처에 융합하고 CC-3DT++ 추적 아키텍처를 도입함으로써 CR3DT는 mAP와 AMOTA가 각각 5.35%와 14.9% 증가하여 3D 표적 탐지 및 추적 정확도를 크게 향상시켰습니다.

카메라와 밀리미터파 레이더를 통합하는 솔루션은 순수 LiDAR나 LiDAR와 카메라를 통합하는 솔루션에 비해 비용이 저렴하다는 장점이 있으며 현재의 자율주행차 개발에 가깝습니다. 또한 밀리미터파 레이더는 악천후에도 견고하다는 장점이 있으며 다양한 응용 시나리오에 직면할 수 있습니다. 현재 큰 문제는 밀리미터파 레이더 포인트 클라우드가 희박하고 높이 정보를 감지할 수 없다는 것입니다. 그러나 4D 밀리미터파 레이더의 지속적인 개발로 인해 향후 카메라와 밀리미터파 레이더 솔루션의 통합이 더 높은 수준에 도달하고 더 나은 결과를 얻을 것이라고 믿습니다!

위 내용은 BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7500

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

4K HD 영상을 쉽게 이해해보세요! 이 대규모 다중 모드 모델은 웹 포스터의 내용을 자동으로 분석하여 작업자에게 매우 편리합니다. Apr 23, 2024 am 08:04 AM

PDF, 웹페이지, 포스터, 엑셀 차트의 내용을 자동으로 분석할 수 있는 대형 모델은 파트타임 근로자에게 그다지 편리하지 않습니다. Shanghai AILab, 홍콩 중문대학교 및 기타 연구 기관에서 제안한 InternLM-XComposer2-4KHD(약칭 IXC2-4KHD) 모델은 이를 현실로 만듭니다. 해상도 제한이 1500x1500 이하인 다른 다중 모드 대형 모델과 비교하여, 이 작업은 다중 모드 대형 모델의 최대 입력 이미지를 4K(3840x1600) 이상의 해상도로 높이고 모든 화면비와 336픽셀을 4K로 지원합니다. 동적 해상도가 변경됩니다. 모델은 출시 3일 만에 허깅페이스 비주얼 질문답변 모델 인기 순위 1위를 차지했다. 취급이 용이함

CVPR 2024 | 사실적인 장면 생성을 위한 LiDAR 확산 모델 Apr 24, 2024 pm 04:28 PM

원제목: TowardsRealisticSceneGenerationwithLiDARDiffusionModels 논문 링크: https://hancyran.github.io/assets/paper/lidar_diffusion.pdf 코드 링크: https://lidar-diffusion.github.io 저자 소속: CMU Toyota Research Institute University of Southern California Paper 아이디어 : 확산 모델(DM)은 사실적인 이미지 합성에 탁월하지만 LiDAR 장면 생성에 적용하는 것은 상당한 과제를 안겨줍니다. 이는 주로 포인트 공간에서 작동하는 DM이 어려움을 겪기 때문입니다.

RV 퓨전 성능이 놀랍습니다! RCBEVDet: 레이더에도 봄이 왔습니다, 최신 SOTA! Apr 02, 2024 am 11:49 AM

위와 같이 작성되었으며 저자의 개인적 이해는 본 토론 논문에서 중점을 두는 주요 이슈가 자율 주행 과정에서 3D 타겟 탐지 기술을 적용하는 것이라는 것입니다. 환경 비전 카메라 기술의 개발은 3D 객체 감지를 위한 고해상도 의미 정보를 제공하지만, 이 방법은 깊이 정보를 정확하게 캡처할 수 없고 악천후나 저조도 조건에서 성능이 저하되는 등의 문제로 인해 제한됩니다. 이러한 문제에 대응하여 서라운드 뷰 카메라와 경제적인 밀리미터파 레이더 센서를 결합한 새로운 다중 모드 3D 표적 탐지 방법인 RCBEVDet을 제안했습니다. 이 방법은 여러 센서의 정보를 종합적으로 활용하여 더 풍부한 의미 정보를 제공하고 악천후나 저조도 조건에서 성능 저하와 같은 문제에 대한 솔루션을 제공합니다. 이 문제를 해결하기 위해 서라운드 뷰 카메라를 결합하는 방법이 논의되었습니다.

LiDAR 시뮬레이션을 위한 새로운 아이디어 | LidarDM: 4D 세계 생성에 도움이 되는 시뮬레이션 킬러~ Apr 12, 2024 am 11:46 AM

원제목: LidarDM: GenerativeLiDARSimulationinaGeneratedWorld 논문 링크: https://arxiv.org/pdf/2404.02903.pdf 코드 링크: https://github.com/vzyrianov/lidardm 저자 소속: University of Illinois, Massachusetts Institute of Technology 논문 아이디어: LidarDM은 사실적이고 레이아웃을 인식하며 물리적으로 믿을 수 있고 시간적으로 일관된 LiDAR 비디오를 생성할 수 있는 새로운 LiDAR 생성 모델입니다. LidarDM은 LiDAR 생성 모델링 분야에서 전례 없는 두 가지 기능을 갖추고 있습니다. (1)

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다. Apr 24, 2024 pm 06:07 PM

위에 작성 및 저자의 개인적 이해 이 글에서는 3D 표적 탐지 및 다중 표적 추적을 위한 카메라-밀리미터파 레이더 융합 방식(CR3DT)을 소개합니다. LiDAR 기반 방법은 이 분야에 대해 높은 표준을 설정했지만 높은 컴퓨팅 성능과 높은 비용으로 인해 자율 주행 분야에서 이 솔루션의 개발이 제한되었습니다. 비용 상대적으로 저렴하고 많은 학자들의 관심을 끌었지만 결과가 좋지 않았습니다. 따라서 카메라와 밀리미터파 레이더의 융합이 유망한 솔루션이 되고 있습니다. 저자는 기존 카메라 프레임워크인 BEVDet에서 밀리미터파 레이더의 공간 및 속도 정보를 융합하고 이를 CC-3DT++ 추적 헤드와 결합하여 3D 표적 탐지 및 추적의 정확도를 크게 향상시켰습니다.

'심층 분석': 자율 주행에서 LiDAR 포인트 클라우드 분할 알고리즘 탐색 Apr 23, 2023 pm 04:46 PM

현재 일반적인 레이저 포인트 클라우드 분할 알고리즘에는 평면 피팅에 기반한 방법과 레이저 포인트 클라우드 데이터의 특성에 기반한 방법이 있습니다. 자세한 내용은 다음과 같습니다. Point Cloud Ground Segmentation Algorithm 01 평면 피팅 기반 방법 - GroundPlaneFitting 알고리즘 아이디어: x 방향(자동차 전면 방향)을 따라 공간을 여러 개의 하위 평면으로 분할하는 간단한 처리 방법입니다. , 그리고 GPF(Ground Plane Fitting Algorithm)를 사용하면 가파른 경사를 처리할 수 있는 지반 분할 방법이 생성됩니다. 이 방법은 단일 프레임 포인트 클라우드에 전역 평면을 맞추는 것입니다. 포인트 클라우드의 수가 많을 때 더 잘 작동합니다. 포인트 클라우드가 희박하면 16라인과 같은 감지 누락 및 잘못된 감지가 발생하기 쉽습니다. 라이더. 알고리즘 의사코드: 의사코드 알고리즘 프로세스는 주어진 포인트 클라우드 P에 대한 분할의 최종 결과입니다.

악천후 조건에서의 LiDAR 감지 기술 솔루션 May 10, 2023 pm 04:07 PM

01Abstract 자율주행차는 다양한 센서를 이용해 주변 환경에 대한 정보를 수집합니다. 차량의 동작은 환경 인식을 바탕으로 계획되므로 안전상의 이유로 신뢰성이 매우 중요합니다. 능동형 LiDAR 센서는 장면을 정확하게 3D로 표현할 수 있어 자율주행차의 환경 인식에 귀중한 추가 요소가 됩니다. LiDAR 성능은 빛의 산란 및 폐색으로 인해 안개, 눈, 비와 같은 악천후 조건에서 변경됩니다. 이러한 제한으로 인해 최근 지각 성능 저하를 완화하는 방법에 대한 상당한 연구가 촉발되었습니다. 본 논문에서는 악천후에 대처하기 위해 LiDAR 기반 환경 감지의 다양한 측면을 수집, 분석 및 논의합니다. 적절한 데이터의 가용성, 원시 포인트 클라우드 처리 및 노이즈 제거, 강력한 인식 알고리즘, 센서 융합과 같은 주제를 논의합니다.

Java로 구현된 레이더 신호처리 기술 소개 Jun 18, 2023 am 10:15 AM

소개: 현대 과학 기술의 지속적인 발전으로 레이더 신호 처리 기술이 점점 더 널리 사용되고 있습니다. 현재 가장 널리 사용되는 프로그래밍 언어 중 하나인 Java는 레이더 신호 처리 알고리즘의 구현에 널리 사용됩니다. 이 기사에서는 Java로 구현된 레이더 신호 처리 기술을 소개합니다. 1. 레이더 신호처리 기술 소개 레이더 신호처리 기술은 레이더 시스템 개발의 핵심이자 영혼이라 할 수 있으며, 레이더 시스템의 자동화 및 디지털화를 구현하는 핵심 기술이다. 레이더 신호 처리 기술에는 파형 처리, 필터링, 펄스 압축 및 적응형 빔 형성이 포함됩니다.

See all articles

BEVFormer를 넘어! CR3DT: RV 융합은 새로운 SOTA(ETH)의 3D 감지 및 추적을 지원합니다.

앞서 작성 및 저자 개인적 이해

주요 기여

모델 아키텍처

BEV 공간의 센서 융합

추적 모듈 아키텍처

실험 및 결과

제한 모델

객체 감지 결과

결론

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제