목차
이전 작성 및 개인적 이해
Field background
AFNet 네트워크 구조
단일 뷰 및 다중 뷰 심도 모듈
멀티 뷰 브랜치
적응형 융합 모듈
실험 결과
기술 주변기기 일체 포함 깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

Mar 23, 2024 pm 01:06 PM
체계 평가하다

이전 작성 및 개인적 이해

다중 시점 깊이 추정은 다양한 벤치마크 테스트에서 높은 성능을 달성했습니다. 그러나 현재의 거의 모든 멀티뷰 시스템은 주어진 이상적인 카메라 포즈에 의존하는데, 이는 자율 주행과 같은 많은 실제 시나리오에서는 사용할 수 없습니다. 이 연구는 다양한 노이즈 포즈 설정에서 깊이 추정 시스템을 평가하기 위한 새로운 견고성 벤치마크를 제안합니다. 놀랍게도 현재의 다중 시점 깊이 추정 방법이나 단일 시점 및 다중 시점 융합 방법은 잡음이 있는 포즈 설정이 주어지면 실패하는 것으로 나타났습니다. 이러한 과제를 해결하기 위해 여기서는 강력하고 정확한 깊이 추정을 달성하기 위해 신뢰도가 높은 다중 뷰 및 단일 뷰 결과를 적응적으로 통합하는 단일 뷰 및 다중 뷰 융합 깊이 추정 시스템인 AFNet을 제안합니다. 적응형 융합 모듈은 소포 신뢰도 맵을 기반으로 두 가지 사이의 신뢰도가 높은 영역을 동적으로 선택하여 융합을 수행합니다. 따라서 질감이 없는 장면, 부정확한 보정, 동적 개체 및 기타 성능이 저하되거나 까다로운 조건에 직면할 때 시스템은 보다 안정적인 분기를 선택하는 경향이 있습니다. 견고성 테스트에서 이 방법은 최첨단 다중 뷰 및 융합 방법보다 성능이 뛰어납니다. 또한 까다로운 벤치마크(KITTI 및 DDAD)에서도 최첨단 성능을 달성했습니다.

논문 링크: https://arxiv.org/pdf/2403.07535.pdf

논문 이름: Adaptive Fusion of Single-View and Multi-View Depth for Autonomous Driving

Field background

이미지 깊이 추정은 항상 광범위한 응용 분야를 갖춘 컴퓨터 비전 분야의 도전이었습니다. 비전 기반 자율 주행 시스템의 경우 도로 위의 물체를 이해하고 환경의 3D 지도를 구축하는 데 도움이 되는 깊이 인식이 핵심입니다. 다양한 시각 문제에 심층 신경망을 적용하면서 CNN(Convolutional Neural Network) 기반 방법이 깊이 추정 작업의 주류가 되었습니다.

입력 형식에 따라 크게 다중 시점 깊이 추정과 단일 시점 깊이 추정으로 나누어집니다. 깊이를 추정하기 위한 다중 뷰 방법의 기본 가정은 올바른 깊이, 카메라 보정 및 카메라 자세가 주어지면 뷰 전체의 픽셀이 유사해야 한다는 것입니다. 그들은 고품질 깊이 측정을 삼각 측량하기 위해 에피폴라 기하학을 사용합니다. 그러나 다중 뷰 방법의 정확성과 견고성은 카메라의 기하학적 구성과 뷰 간의 해당 일치에 크게 좌우됩니다. 첫째, 카메라는 삼각 측량이 가능하도록 충분히 이동해야 합니다. 자율주행 시나리오에서 자율주행차는 신호등에 정지하거나 전진하지 않고 회전할 수 있으며, 이로 인해 삼각 측량이 실패할 수 있습니다. 또한, 멀티뷰 방식은 자율주행 시나리오에서 흔히 나타나는 동적 대상과 질감이 없는 영역의 문제로 어려움을 겪고 있습니다. 또 다른 문제는 움직이는 차량에 대한 SLAM 자세 최적화입니다. 기존 SLAM 방식에서는 어렵고 피할 수 없는 상황은 말할 것도 없고 소음도 불가피합니다. 예를 들어, 로봇이나 자율주행차는 재보정 없이 수년간 배치되어 시끄러운 자세를 초래할 수 있습니다. 대조적으로, 단일 뷰 방법은 장면의 의미론적 이해와 원근 투영 큐에 의존하기 때문에 텍스처가 없는 영역, 동적 객체에 더 강력하고 카메라 포즈에 의존하지 않습니다. 그러나 규모의 모호성으로 인해 성능은 여전히 ​​멀티뷰 방식에 크게 뒤떨어집니다. 여기서 우리는 자율 주행 시나리오에서 강력하고 정확한 단안 비디오 깊이 추정을 위해 이 두 가지 방법의 장점을 잘 결합할 수 있는지 고려하는 경향이 있습니다.

AFNet 네트워크 구조

AFNet 구조는 다음과 같습니다. 단일 뷰 분기, 다중 뷰 분기 및 AF(적응형 융합) 모듈의 세 부분으로 구성됩니다. 두 가지 분기는 특징 추출 네트워크를 공유하고 자체 예측 및 신뢰도 맵(즉, , 및 )을 가지며 AF 모듈에 의해 융합되어 최종 정확하고 강력한 예측을 얻습니다. AF 모듈의 녹색 배경은 단일을 나타냅니다. -view 분기 및 다중 보기 분기의 출력입니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

손실 함수:

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

단일 뷰 및 다중 뷰 심도 모듈

백본 기능을 병합하고 심층 기능 D를 얻기 위해 AFNet은 다중 스케일 디코더를 구축합니다. 이 과정에서 Ds의 처음 256개 채널에 대해 소프트맥스 연산을 수행하여 깊이 확률량 Ps를 구한다. 깊이 기능의 마지막 채널은 단일 뷰 깊이 신뢰 맵 Ms로 사용됩니다. 마지막으로 단일 뷰 깊이는 소프트 가중치를 통해 계산됩니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

멀티 뷰 브랜치

멀티 뷰 브랜치는 싱글 뷰 브랜치와 백본을 공유하여 참조 이미지와 소스 이미지의 특징을 추출합니다. 우리는 저해상도 기능을 1/4 해상도로 디콘볼루션하고 비용 볼륨을 구성하는 데 사용되는 초기 1/4 기능과 결합하기 위해 디콘볼루션을 채택합니다. 피처 볼륨은 소스 피처를 참조 카메라가 뒤따르는 가상 평면으로 래핑하여 형성됩니다. 너무 많은 정보가 필요하지 않은 강건한 매칭을 위해 특징의 채널 차원을 계산에 유지하고 4D 비용 볼륨을 구성한 다음 두 개의 3D 컨볼루셔널 레이어를 통해 채널 수를 1개로 줄입니다.

깊이 가설의 샘플링 방법은 단일 뷰 분기와 일치하지만 샘플 수는 128개에 불과하며, 누적된 2D 모래시계 네트워크를 사용하여 정규화하여 최종 다중 뷰 비용 볼륨을 얻습니다. 단일 뷰 특징의 풍부한 의미 정보와 비용 정규화로 인해 손실된 세부 정보를 보완하기 위해 잔여 구조를 사용하여 단일 뷰 깊이 특징 D와 비용 볼륨을 결합하여 다음과 같이 융합된 깊이 특징을 얻습니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

적응형 융합 모듈

정확하고 견고한 최종 예측을 얻기 위해 AF 모듈은 그림 2와 같이 두 분기 사이에서 가장 정확한 깊이를 최종 출력으로 적응적으로 선택하도록 설계되었습니다. 융합 매핑은 세 가지 신뢰도를 통해 수행되며, 그 중 두 개는 두 분기에 의해 각각 생성된 신뢰도 맵 Ms와 Mm입니다. 가장 중요한 것은 다중 뷰 분기의 예측이 올바른지 여부를 결정하기 위해 포워드 래핑을 통해 생성된 신뢰도 맵 Mw입니다. 믿을 수 있는. .

실험 결과

DDAD(Dense Depth for Autonomous Driving)는 까다롭고 다양한 도시 조건에서 조밀한 깊이 추정을 위한 새로운 자율 주행 벤치마크입니다. 6개의 동기화된 카메라로 캡처되며 고밀도 LiDAR에서 생성된 정확한 지면 깊이(전체 360도 시야)를 포함합니다. 1936×1216 해상도의 단일 카메라 뷰에는 12650개의 훈련 샘플과 3950개의 검증 샘플이 있습니다. 6개 카메라의 모든 데이터는 훈련과 테스트에 사용됩니다. KITTI 데이터 세트는 움직이는 차량에서 촬영한 실외 장면의 입체 이미지와 해당 3D 레이저 스캔을 약 1241×376의 해상도로 제공합니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

DDAD와 KITTI 평가 결과 비교. * 표시는 오픈 소스 코드를 사용하여 복제된 결과이며, 보고된 다른 숫자는 해당 원본 논문에서 나온 것입니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

DDAD 방법의 각 전략에 대한 절제 실험 결과입니다. Single은 단일 시점 분기 예측 결과를 나타내고, Multi-는 다중 시점 분기 예측 결과를 나타내며, Fuse는 융합 결과 dfuse를 나타냅니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

절제 결과의 특징 추출을 위해 네트워크 매개변수를 공유하고 일치 정보를 추출하는 방법입니다.

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합

위 내용은 깊이 추정 SOTA! 자율 주행을 위한 단안 및 서라운드 깊이의 적응형 융합의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

CUDA의 보편적인 행렬 곱셈: 입문부터 숙련까지! CUDA의 보편적인 행렬 곱셈: 입문부터 숙련까지! Mar 25, 2024 pm 12:30 PM

GEMM(일반 행렬 곱셈)은 많은 응용 프로그램과 알고리즘의 중요한 부분이며 컴퓨터 하드웨어 성능을 평가하는 중요한 지표 중 하나이기도 합니다. GEMM 구현에 대한 심층적인 연구와 최적화는 고성능 컴퓨팅과 소프트웨어와 하드웨어 시스템 간의 관계를 더 잘 이해하는 데 도움이 될 수 있습니다. 컴퓨터 과학에서 GEMM의 효과적인 최적화는 컴퓨팅 속도를 높이고 리소스를 절약할 수 있으며, 이는 컴퓨터 시스템의 전반적인 성능을 향상시키는 데 중요합니다. GEMM의 작동 원리와 최적화 방법에 대한 심층적인 이해는 현대 컴퓨팅 하드웨어의 잠재력을 더 잘 활용하고 다양하고 복잡한 컴퓨팅 작업에 대한 보다 효율적인 솔루션을 제공하는 데 도움이 될 것입니다. GEMM의 성능을 최적화하여

화웨이의 Qiankun ADS3.0 지능형 운전 시스템은 8월에 출시될 예정이며 처음으로 Xiangjie S9에 출시될 예정입니다. 화웨이의 Qiankun ADS3.0 지능형 운전 시스템은 8월에 출시될 예정이며 처음으로 Xiangjie S9에 출시될 예정입니다. Jul 30, 2024 pm 02:17 PM

7월 29일, AITO Wenjie의 400,000번째 신차 출시 행사에 Huawei 전무이사이자 Terminal BG 회장이자 Smart Car Solutions BU 회장인 Yu Chengdong이 참석하여 연설을 했으며 Wenjie 시리즈 모델이 출시될 것이라고 발표했습니다. 올해 출시 예정 지난 8월 Huawei Qiankun ADS 3.0 버전이 출시되었으며, 8월부터 9월까지 순차적으로 업그레이드를 추진할 계획입니다. 8월 6일 출시되는 Xiangjie S9에는 화웨이의 ADS3.0 지능형 운전 시스템이 최초로 탑재됩니다. LiDAR의 도움으로 Huawei Qiankun ADS3.0 버전은 지능형 주행 기능을 크게 향상시키고, 엔드투엔드 통합 기능을 갖추고, GOD(일반 장애물 식별)/PDP(예측)의 새로운 엔드투엔드 아키텍처를 채택합니다. 의사결정 및 제어), 주차공간부터 주차공간까지 스마트 드라이빙의 NCA 기능 제공, CAS3.0 업그레이드

Apple 16 시스템의 어떤 버전이 가장 좋나요? Apple 16 시스템의 어떤 버전이 가장 좋나요? Mar 08, 2024 pm 05:16 PM

Apple 16 시스템의 최고 버전은 iOS16.1.4입니다. iOS16 시스템의 최고 버전은 사람마다 다를 수 있으며 일상적인 사용 경험의 추가 및 개선도 많은 사용자로부터 호평을 받았습니다. Apple 16 시스템의 가장 좋은 버전은 무엇입니까? 답변: iOS16.1.4 iOS 16 시스템의 가장 좋은 버전은 사람마다 다를 수 있습니다. 공개 정보에 따르면 2022년에 출시된 iOS16은 매우 안정적이고 성능이 뛰어난 버전으로 평가되며, 사용자들은 전반적인 경험에 상당히 만족하고 있습니다. 또한, iOS16에서는 새로운 기능 추가와 일상 사용 경험 개선도 많은 사용자들에게 호평을 받고 있습니다. 특히 업데이트된 배터리 수명, 신호 성능 및 발열 제어 측면에서 사용자 피드백은 비교적 긍정적이었습니다. 그러나 iPhone14를 고려하면

항상 새로운! Huawei Mate60 시리즈가 HarmonyOS 4.2로 업그레이드: AI 클라우드 향상, Xiaoyi Dialect는 사용하기 매우 쉽습니다. 항상 새로운! Huawei Mate60 시리즈가 HarmonyOS 4.2로 업그레이드: AI 클라우드 향상, Xiaoyi Dialect는 사용하기 매우 쉽습니다. Jun 02, 2024 pm 02:58 PM

4월 11일, 화웨이는 처음으로 HarmonyOS 4.2 100개 시스템 업그레이드 계획을 공식 발표했습니다. 이번에는 휴대폰, 태블릿, 시계, 헤드폰, 스마트 스크린 및 기타 장치를 포함하여 180개 이상의 장치가 업그레이드에 참여할 것입니다. 지난달 HarmonyOS4.2 100대 업그레이드 계획이 꾸준히 진행됨에 따라 Huawei Pocket2, Huawei MateX5 시리즈, nova12 시리즈, Huawei Pura 시리즈 등을 포함한 많은 인기 모델도 업그레이드 및 적응을 시작했습니다. 더 많은 Huawei 모델 사용자가 HarmonyOS가 제공하는 일반적이고 종종 새로운 경험을 즐길 수 있을 것입니다. 사용자 피드백에 따르면 HarmonyOS4.2를 업그레이드한 후 Huawei Mate60 시리즈 모델의 경험이 모든 측면에서 개선되었습니다. 특히 화웨이 M

컴퓨터 운영 체제는 무엇입니까? 컴퓨터 운영 체제는 무엇입니까? Jan 12, 2024 pm 03:12 PM

컴퓨터 운영체제는 컴퓨터 하드웨어와 소프트웨어 프로그램을 관리하는 데 사용되는 시스템이기도 하며, 모든 소프트웨어 시스템을 기반으로 개발된 운영체제 프로그램이기도 합니다. 아래에서 편집자는 컴퓨터 운영 체제가 무엇인지 공유합니다. 소위 운영 체제는 컴퓨터 하드웨어 및 소프트웨어 프로그램을 관리하는 것입니다. 모든 소프트웨어는 운영 체제 프로그램을 기반으로 개발됩니다. 실제로 산업용, 상업용, 개인용 등 광범위한 응용 프로그램을 포괄하는 다양한 유형의 운영 체제가 있습니다. 아래에서는 편집자가 컴퓨터 운영 체제가 무엇인지 설명합니다. Windows 시스템이란 어떤 컴퓨터 운영 체제입니까? Windows 시스템은 미국 Microsoft Corporation에서 개발한 운영 체제입니다. 무엇보다

Linux 및 Windows 시스템에서 cmd 명령의 차이점과 유사점 Linux 및 Windows 시스템에서 cmd 명령의 차이점과 유사점 Mar 15, 2024 am 08:12 AM

Linux와 Windows는 각각 오픈 소스 Linux 시스템과 상용 Windows 시스템을 대표하는 두 가지 일반적인 운영 체제입니다. 두 운영 체제 모두 사용자가 운영 체제와 상호 작용할 수 있는 명령줄 인터페이스가 있습니다. Linux 시스템에서는 사용자가 Shell 명령줄을 사용하고 Windows 시스템에서는 cmd 명령줄을 사용합니다. Linux 시스템의 Shell 명령줄은 거의 모든 시스템 관리 작업을 완료할 수 있는 매우 강력한 도구입니다.

Oracle 데이터베이스에서 시스템 날짜를 수정하는 방법에 대한 자세한 설명 Oracle 데이터베이스에서 시스템 날짜를 수정하는 방법에 대한 자세한 설명 Mar 09, 2024 am 10:21 AM

Oracle 데이터베이스에서 시스템 날짜를 수정하는 방법에 대한 자세한 설명 Oracle 데이터베이스에서 시스템 날짜를 수정하는 방법은 주로 NLS_DATE_FORMAT 매개 변수를 수정하고 SYSDATE 함수를 사용하는 것입니다. 이 기사에서는 독자가 Oracle 데이터베이스에서 시스템 날짜를 수정하는 작업을 더 잘 이해하고 숙달할 수 있도록 이 두 가지 방법과 구체적인 코드 예제를 자세히 소개합니다. 1. NLS_DATE_FORMAT 매개변수 메소드 수정 NLS_DATE_FORMAT은 Oracle 데이터입니다.

시스템 글꼴 저장 경로는 어디에 있나요? 시스템 글꼴 저장 경로는 어디에 있나요? Feb 19, 2024 pm 09:11 PM

시스템 글꼴은 어느 폴더에 있습니까? 현대 컴퓨터 시스템에서 글꼴은 읽기 경험과 텍스트 표현의 아름다움에 영향을 미치는 중요한 역할을 합니다. 개인화 및 사용자 정의에 관심이 있는 일부 사용자의 경우 시스템 글꼴의 저장 위치를 ​​이해하는 것이 특히 중요합니다. 그렇다면 시스템 글꼴은 어느 폴더에 저장되어 있습니까? 이 기사에서는 모든 사람을 위해 하나씩 공개합니다. Windows 운영 체제에서 시스템 글꼴은 "Fonts"라는 폴더에 저장됩니다. 이 폴더는 기본적으로 Win의 C 드라이브에 있습니다.

See all articles