새로운 Range View3D 감지 아이디어: RangePerception
제목 재작성: 범위 인식: 효율적이고 정확한 3D 개체 감지를 위한 LiDAR 범위 보기 길들이기
논문을 보려면 다음 링크를 클릭하세요: https://openreview.net/pdf?id=9kFQEJSyCM
저자 소속: Shanghai Artificial 지능 연구실 복단대학교 개작 후: 단위: 푸단대학교 상하이 인공지능 연구실
논문 아이디어:
현재 LiDAR 기반 3D 탐지 방법은 주로 조감도(BEV) 또는 범위 보기(RV)를 기반으로 합니다. . BEV 방법은 복셀화 및 3D 컨볼루션에 의존하므로 교육 및 추론 프로세스의 효율성이 떨어집니다. 이에 비해 RV 방식은 콤팩트하고 2D 컨볼루션과의 호환성으로 인해 더 높은 효율성을 보이지만 여전히 BEV 방식에 비해 성능이 뒤떨어진다. RV 방법의 효율성을 유지하면서 성능 격차를 해소하기 위해 본 연구에서는 RangePerception이라는 효율적이고 정확한 RV 기반 3D 객체 탐지 프레임워크를 제안합니다. 본 연구는 신중한 분석을 통해 기존 RV 방법의 성능을 방해하는 두 가지 주요 과제를 식별했습니다. 1) 출력에 사용된 3D 세계 좌표와 입력에 사용된 2D 범위 이미지 좌표 간에 자연스러운 도메인 간격이 있습니다. 2) 원본 거리 이미지는 시각적 손상 문제가 있어 범위 이미지 가장자리에 위치한 대상의 탐지 정확도에 영향을 미칩니다. 이러한 문제를 해결하기 위해 이 논문에서는 범위 이미지 표현과 세계 좌표 3D 감지 결과의 정보 흐름을 촉진하는 RAK(Range Aware Kernel) 및 VRM(Vision Restoration Module)이라는 두 가지 새로운 알고리즘을 제안합니다. RAK 및 VRM의 도움으로 RangePerception은 Waymo Open Dataset의 이전 최첨단 RV 방법 RangeDet에 비해 평균 L1/L2 AP를 3.25/4.18 향상합니다. RangePerception은 최초의 RV 기반 3D 감지 방법으로 유명한 BEV 기반 방법인 CenterPoint에 비해 평균 AP가 약간 더 높으며 추론 속도는 CenterPoint의 1.3배입니다.
네트워크 설계:
이 기사 RangePerception이라는 효율적이고 정확한 RV 기반 3D 감지 프레임워크를 보여줍니다. 위의 주요 과제를 극복하기 위해 RAK(Range Aware Kernel) 및 VRM(Vision Restoration Module)이라는 두 가지 새로운 알고리즘이 제안되어 RangePerception 프레임워크에 통합되었습니다. 두 알고리즘 모두 범위 이미지 표현과 테스트 결과의 세계 조정 3D 정보 흐름을 용이하게 합니다. RAK 및 VRM의 도움으로 당사의 RangePerception은 차량, 보행자 및 자전거 이용자를 위한 WOD에서 73.62, 80.24 및 70.33 L1 3D AP를 제공하여 범위 뷰 기반 3D 감지 방법으로 최첨단 성능을 달성합니다. 이 글의 기여는 다음과 같습니다.
RangePerception 프레임워크. 이 문서에서는 RangePerception이라는 새로운 고성능 3D 감지 프레임워크를 소개합니다. RangePerception은 최초의 RV 기반 3D 감지기로 WOD에서 74.73/69.17의 평균 L1/L2 AP를 달성합니다. 이는 평균 L1/L2를 갖는 이전 최첨단 RV 기반 감지기 RangeDet보다 우수합니다. AP는 71.48/64.99로 3.25/4.18의 개선을 보여줍니다. RangePerception은 또한 평균 L1/L2 AP 74.25/68.04를 달성하는 널리 사용되는 BEV 기반 방법인 CenterPoint[6]에 비해 약간 우수한 성능을 보여줍니다. 특히 RangePerception의 추론 속도는 CenterPoint보다 1.3배 빨라 자율주행 차량의 실시간 배포에 더 적합하다는 것이 입증되었습니다.
Range Aware Kernel. RangePerception 기능 추출기의 일부인 RAK(Range Aware Kernel)는 RV 기반 네트워크에 맞춰진 획기적인 알고리즘입니다. RAK는 범위 이미지 공간을 여러 부분 공간으로 분해하고 각 부분 공간에서 독립적으로 특징을 추출하여 공간 정렬 문제를 극복합니다. 실험 결과에 따르면 RAK는 무시할 수 있는 계산 비용으로 평균 L1/L2 AP를 5.75/5.99 향상시키는 것으로 나타났습니다.
시력 복원 모듈 시력 손상 문제(Vision Corruption Issue)를 해결하기 위해 본 연구에서는 VRM(Vision Restoration Module)을 제안합니다. VRM은 이전에 손상된 영역을 복원하여 백본 네트워크의 수용 필드를 확장합니다. VRM은 실험 섹션에서 볼 수 있듯이 차량 감지에 특히 유용합니다.
그림 2: RangePerception 프레임워크는 범위 이미지 I를 입력으로 사용하여 조밀한 예측을 생성합니다. 표현 학습 효과를 향상시키기 위해 프레임워크는 Range Backbone 이전에 VRM 및 RAK 모듈을 순차적으로 통합합니다. 그런 다음 특별히 설계된 Redundancy Pruner를 사용하여 심층 기능의 중복성을 제거함으로써 후속 Region Proposal Network 및 후처리 레이어의 계산 비용을 줄입니다
그림 1: (a-d) 각각 RV 및 BEV로 표시되는 상단 LiDAR 신호의 예제 프레임. (e) 공간적 오정렬 현상. (f) 시력 손상 현상.
그림 3: 범위 인식 커널은 범위 이미지 공간을 여러 하위 공간으로 분해하고 각 하위 공간에서 독립적인 특징을 추출하여 공간 정렬 문제를 극복합니다.
그림 5: 시력 복원 모듈. VRM은 복구 각도 δ를 미리 정의함으로써 방위각 θ ∈ [−δ, 2π + δ]로 확장된 구형 공간을 구성합니다. 따라서 범위 이미지 I의 양쪽 측면의 시각적 손상 문제가 해결되어 I의 가장자리에서 특징을 추출하는 과정이 크게 단순화됩니다.
실험 결과:
요약:
이 문서에서는 효과적으로 문제를 해결할 수 있는 RV 기반 3차원 감지 프레임워크인 공간 RangePerception에 대해 설명합니다. 정렬 불량 및 시각적 손상 수수께끼. RAK 및 VRM 기술을 도입함으로써 RangePerception은 WOD에 대한 탁월한 감지 기능을 입증하는 동시에 효율적이고 정확한 실제 배포 잠재력도 입증했습니다.
인용:
@inproceedings{bai2023rangeperception,title={RangePerception: Taming Li{DAR} Range View for Efficient and Accurate 3D Object Detection},author={Yeqi BAI and Ben Fei and Youquan Liu and Tao MA and Yuenan Hou and Botian Shi and Yikang LI},booktitle={Thirty-seventh Conference on Neural Information Processing Systems},year={2023},url={https://openreview.net/forum?id=9kFQEJSyCM}}
원본 링크: https://mp .weixin.qq .com/s/EJCl5kLxhHaa7lh98g2I6w
위 내용은 새로운 Range View3D 감지 아이디어: RangePerception의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Java 프레임워크에 대한 상용 지원의 비용/성능 평가에는 다음 단계가 포함됩니다. 필요한 보증 수준과 SLA(서비스 수준 계약) 보장을 결정합니다. 연구지원팀의 경험과 전문성. 업그레이드, 문제 해결, 성능 최적화와 같은 추가 서비스를 고려하십시오. 위험 완화 및 효율성 향상을 기준으로 비즈니스 지원 비용을 평가합니다.

PHP 프레임워크의 학습 곡선은 언어 숙련도, 프레임워크 복잡성, 문서 품질 및 커뮤니티 지원에 따라 달라집니다. PHP 프레임워크의 학습 곡선은 Python 프레임워크에 비해 높고 Ruby 프레임워크에 비해 낮습니다. Java 프레임워크에 비해 PHP 프레임워크는 학습 곡선이 적당하지만 시작하는 데 걸리는 시간이 더 짧습니다.

경량 PHP 프레임워크는 작은 크기와 낮은 리소스 소비를 통해 애플리케이션 성능을 향상시킵니다. 그 특징은 다음과 같습니다: 작은 크기, 빠른 시작, 낮은 메모리 사용량, 향상된 응답 속도 및 처리량, 리소스 소비 감소 실제 사례: SlimFramework는 500KB에 불과한 REST API를 생성하며 높은 응답성과 높은 처리량을 제공합니다.

RedMagic Tablet 3D Explorer Edition은 Gaming Tablet Pro와 함께 출시되었습니다. 그러나 후자가 게이머를 위한 반면 전자는 엔터테인먼트에 더 적합합니다. 새로운 Android 태블릿에는 회사에서 "육안 3D&qu"라고 부르는 기능이 있습니다.

Golang 프레임워크에서는 명확하고 포괄적인 문서를 작성하는 것이 중요합니다. 모범 사례에는 Google의 Go 코딩 스타일 가이드와 같은 확립된 문서 스타일을 따르는 것이 포함됩니다. 제목, 부제, 목록 등 명확한 조직 구조를 사용하고 탐색 기능을 제공하세요. 시작 안내서, API 참조 및 개념을 포함하여 포괄적이고 정확한 정보를 제공합니다. 코드 예제를 사용하여 개념과 사용법을 설명합니다. 문서를 계속 업데이트하고, 변경 사항을 추적하고, 새로운 기능을 문서화하세요. GitHub 문제 및 포럼과 같은 지원 및 커뮤니티 리소스를 제공합니다. API 문서와 같은 실용적인 예제를 만듭니다.

애플리케이션 시나리오를 기반으로 최고의 Go 프레임워크를 선택하세요. 애플리케이션 유형, 언어 기능, 성능 요구 사항 및 생태계를 고려하세요. Common Go 프레임워크: Gin(웹 애플리케이션), Echo(웹 서비스), Fiber(높은 처리량), gorm(ORM), fasthttp(속도). 실제 사례: REST API(Fiber) 구축 및 데이터베이스(gorm)와 상호 작용. 프레임워크를 선택하세요. 주요 성능을 위해서는 fasthttp를 선택하고, 유연한 웹 애플리케이션을 위해서는 Gin/Echo를, 데이터베이스 상호작용을 위해서는 gorm을 선택하세요.

Go 프레임워크 학습에는 다섯 가지 오해가 있습니다. 프레임워크에 대한 과도한 의존과 제한된 유연성입니다. 프레임워크 규칙을 따르지 않으면 코드를 유지 관리하기가 어려워집니다. 오래된 라이브러리를 사용하면 보안 및 호환성 문제가 발생할 수 있습니다. 패키지를 과도하게 사용하면 코드 구조가 난독화됩니다. 오류 처리를 무시하면 예기치 않은 동작과 충돌이 발생합니다.

Go 프레임워크 개발에서 일반적인 과제와 해결 방법은 다음과 같습니다. 오류 처리: 관리에는 오류 패키지를 사용하고 중앙에서 오류를 처리하려면 미들웨어를 사용합니다. 인증 및 권한 부여: 타사 라이브러리를 통합하고 사용자 정의 미들웨어를 생성하여 자격 증명을 확인합니다. 동시 처리: 고루틴, 뮤텍스 및 채널을 사용하여 리소스 액세스를 제어합니다. 단위 테스트: 격리를 위해 getest 패키지, 모의 및 스텁을 사용하고, 충분성을 보장하기 위한 코드 적용 도구를 사용합니다. 배포 및 모니터링: Docker 컨테이너를 사용하여 배포를 패키징하고, 데이터 백업을 설정하고, 로깅 및 모니터링 도구를 사용하여 성능과 오류를 추적합니다.
