새 타이틀: 실시간 렌더링이 진화했습니다! 광선을 기반으로 한 혁신적인 3차원 재구성 방법
Pictures
문서 링크:https://arxiv.org/pdf/2310.19629
코드 링크:https://github.com/vLAR-group/RayDF
홈페이지:필수 재작성된 콘텐츠는 다음과 같습니다: https://vlar-group.github.io/RayDF.html
재작성된 콘텐츠: 구현 방법:
RayDF의 전체 프로세스 및 구성 요소는 다음과 같습니다(그림 1 참조).
1. 소개
머신 비전 및 로봇 공학 분야의 많은 최첨단 응용 분야에서 정확하고 효율적인 세 가지를 배웁니다. -차원적인 도형 표현이 매우 중요합니다. 그러나 기존의 3차원 좌표 기반 암시적 표현은 3차원 형상을 표현하거나 2차원 이미지를 렌더링할 때 많은 계산 비용이 소요되는 반면, 광선 기반 방법은 3차원 형상을 효율적으로 추론할 수 있습니다. 그러나 기존의 광선 기반 방법은 다시점 각도에서의 기하학적 일관성을 고려하지 않아 알 수 없는 시야각에서 정확한 기하학적 형상을 복원하기 어렵습니다. 이러한 문제를 해결하기 위해 본 논문에서는 다시점을 유지하는 새로운 방법을 제안합니다. 기하학적 일관성. RayDF라는 광선 기반 암시적 표현 방법입니다. 이 방법은 새로운 이중 광선 가시성 분류기와 다중 뷰 일관성 최적화 모듈을 도입하여 간단한 광선-표면 거리 필드를 기반으로 합니다. )
, 여러 보기 각도의 기하학적 일관성을 충족하는 광선-표면 거리를 얻는 방법을 학습합니다. . 실험 결과는 수정된 방법이 세 가지 데이터 세트에서 우수한 3D 표면 재구성 성능을 달성하고 좌표 기반 방법보다 1000배 빠른 렌더링 속도를 달성한다는 것을 보여줍니다(표 1 참조).
다음은 주요 기여입니다.
광선-표면 거리 필드를 사용하여 3차원 도형을 표현하는 이 표현식은 기존 좌표 기반 표현식보다 효율적입니다.
- 새로운 이중 광선 가시성 분류기를 설계했습니다. 광선 쌍의 공간 관계를 학습함으로써 학습된 광선 표면 거리 필드가 여러 시야각에서 기하학적 일관성을 유지할 수 있습니다.
- 3D 형상 재구성에서 이 방법의 정확성과 효율성은 여러 데이터 세트에서 입증되었습니다.
-
2. 방법
그림 2 광선 매개변수화 및 광선-표면 거리장의 네트워크 구조
이중선 가시성 분류기의 프레임워크 구조는 그림 3과 같습니다.
(1) 먼저 보조 네트워크 이중 광선 가시성 분류기에 대한 훈련을 위한 광선 쌍을 구성합니다. 그림의 광선(그림의 픽셀에 해당)의 경우 해당 공간 표면 지점은 광선 표면 거리를 통해 알 수 있습니다. 이를 훈련 세트의 나머지 시야각에 투영하여 다른 광선과 이 광선을 얻습니다. 해당 광선 표면 거리가 있습니다. 기사에서는 두 광선이 서로 보이는지 여부를 결정하기 위해 임계값을 10mm로 설정합니다.
(2) 두 번째 단계는 예측 거리 필드가 다중 시점 일관성을 충족하도록 주 네트워크 광선-표면 거리 네트워크를 훈련시키는 것입니다. 그림 4에서 보는 바와 같이 주광선과 그 표면점에 대해 표면점을 구의 중심으로 균일하게 샘플링하여 여러 개의 다시점 광선을 얻는다. 주 광선과 이러한 다중 뷰 광선을 하나씩 결합하면 훈련된 이중 광선 가시성 분류기를 통해 상호 가시성을 얻을 수 있습니다. 그런 다음 광선 표면 거리 네트워크를 통해 이러한 광선의 광선 표면 거리를 예측합니다. 주 광선과 특정 샘플링 광선이 서로 표시되면 두 광선의 광선 표면 거리로 계산된 표면 점이 동일해야 합니다. 해당 손실 함수가 설계되고 메인 네트워크가 훈련되어 궁극적으로 광선-표면 거리 필드가 다중 뷰 일관성을 충족할 수 있습니다.
2.4 표면 법선 도출 및 이상점 제거
장면 표면 가장자리의 깊이 값에는 종종 돌연변이(불연속성)가 있고 신경망은 연속 함수이므로 위의 광선-표면 거리 필드는 다음과 같습니다. 표면에서 가장자리에서는 부정확한 거리 값을 예측하기 쉽고, 가장자리의 기하학적 표면에 노이즈가 발생합니다. 다행히 설계된 광선-표면 거리장은 그림 5와 같이 좋은 특징을 가지고 있습니다. 추정된 각 3차원 표면 지점의 법선 벡터는 네트워크의 자동 미분을 통해 닫힌 형태로 쉽게 찾을 수 있습니다. 따라서 네트워크 추론 단계에서 표면 점의 법선 벡터의 유클리드 거리를 계산할 수 있으며, 거리 값이 임계값보다 크면 표면 점을 이상값으로 간주하여 제거함으로써 깨끗한 3차원을 얻을 수 있습니다. 재구성된 표면.
그림 5 표면 법선 계산
III. 실험
제안한 방법의 유효성을 확인하기 위해 세 가지 데이터 세트에 대한 실험을 수행했습니다. 이 세 가지 데이터 세트는 객체 수준 합성 데이터 세트 Blender [1], 장면 수준 합성 데이터 세트 DM-SR [2] 및 장면 수준 실제 데이터 세트 ScanNet [3]입니다. 성능 비교를 위해 7가지 기준을 선택했습니다. 그 중 OF [4]/DeepSDF [5]/NDF [6]/NeuS [7]는 좌표 기반 레벨 설정 방법이고, DS-NeRF [8]는 깊이 감독 NeRF 기반 방법, LFN [ 9]와 PRIF [10]은 두 개의 광선 기반 기준선입니다.
RayDF 방법은 텍스처를 학습하기 위해 직접적으로 복사 분기를 추가할 수 있기 때문에 복사 필드 예측을 지원하는 기본 모델과 비교할 수 있습니다. 따라서 본 논문의 비교 실험은 두 그룹으로 나누어진다. 첫 번째 그룹(그룹 1)은 거리(기하학)만 예측하고, 두 번째 그룹(그룹 2)은 거리와 광도(기하학 및 질감)를 모두 예측한다.
3.1 평가 블렌더 데이터세트
표 2와 그림 6에서 볼 수 있듯이 그룹 1과 2에서 RayDF는 표면 재구성, 특히 가장 중요한 ADE 표시기에서 좌표와 광선을 기반으로 한 기준선보다 훨씬 더 나은 결과를 얻었습니다. 동시에 Radiance Field 렌더링 측면에서도 RayDF는 DS-NeRF에 필적하고 LFN 및 PRIF보다 우수한 성능을 달성했습니다.
그림 6 Blender 데이터 세트의 시각적 비교
3.2 DM-SR 데이터 세트 평가
표 3에서 볼 수 있듯이 가장 중요한 ADE 지표에서 RayDF는 모든 기준을 능가합니다. 동시에 Group 2 실험에서 RayDF는 정확한 표면 형상이 복원되었음을 확인하면서 고품질의 새로운 뷰 합성을 얻을 수 있었습니다(그림 7 참조).
그림 7 DM-SR 데이터 세트의 시각적 비교
3.3 ScanNet 데이터 세트 평가
표 4는 까다로운 실제 시나리오에서 RayDF의 성능과 기준선을 비교합니다. 첫 번째 및 두 번째 그룹에서 RayDF는 거의 모든 평가 지표에서 기준보다 훨씬 뛰어난 성능을 보여 복잡한 실제 3D 장면
을 복구하는 데 분명한 이점을 보여줍니다. 다음은 데이터 세트의 시각적 비교를 위해 그림 8 ScanNet 재작성된 콘텐츠입니다. 그림 8에서는 ScanNet 데이터 세트의 시각적 비교 결과를 보여줍니다.
3.4 Ablation Study
Blender 데이터 세트에 대해 Ablation 실험을 수행했습니다. 논문의 표 5는 핵심 Dual-Ray Visibility Classifier의 Ablation 실험 결과를 보여줍니다.
- 는 표 5(1)에 나와 있습니다. 이중 광선 가시성 분류기의 도움이 없으면 광선 표면 거리 필드는 새로운 시야각에서 광선에 대한 합리적인 거리 값을 예측할 수 없습니다(그림 참조). 9).
- 분류기의 입력에서는 표 5의 (2)와 (3)과 같이 입력된 표면 점 좌표가 보조로 선택되거나 표면 점 거리 값이 보조로 선택되거나 보조 정보가 제공되지 않는 경우 분류기의 정확도가 낮고 F1 점수가 획득되므로 광선 표면 거리 네트워크에 제공되는 가시성 정보가 부족하여 잘못된 거리 값을 예측하게 됩니다.
- 표 5(4)에서 볼 수 있듯이 한 쌍의 광선을 비대칭 방식으로 입력하면 훈련된 분류기의 정확도는 높아지지만 F1 점수는 낮아집니다. 이는 이 분류기가 대칭 입력 광선으로 훈련된 분류기보다 훨씬 덜 강력하다는 것을 보여줍니다.
다른 절제 작업은 종이와 종이 부록에서 볼 수 있습니다
다시 작성해야 하는 내용은 다음과 같습니다. 그림 9는 분류기를 사용하는 것과 분류기를 사용하지 않는 것을 시각적으로 비교한 것입니다
IV. 결론
광선 기반 다중 시점 일관성 프레임워크를 사용하여 연구를 진행하면서 본 논문은 이 방법을 통해 3차원 형상 표현을 효율적이고 정확하게 학습할 수 있다는 결론에 도달했습니다. 논문에서는 간단한 광선-표면 거리 필드를 사용하여 3차원 형상의 기하학을 표현하고, 새로운 이중 광선 가시성 분류기를 사용하여 다중 시점 기하학적 일관성을 더욱 달성했습니다. 여러 데이터 세트에 대한 실험을 통해 RayDF 방법은 렌더링 효율성이 매우 높고 성능이 우수하다는 것이 입증되었습니다. RayDF 프레임워크에 대한 추가 확장을 환영합니다. 홈페이지에서 더 많은 시각화 결과를 보실 수 있습니다
다시 작성해야 할 내용은 다음과 같습니다: https://vlar-group.github.io/RayDF.html
다시 작성해야 할 내용은 원본입니다. 링크 : https://mp.weixin.qq.com/s/dsrSHKT4NfgdDPYcKOhcOA
위 내용은 새 타이틀: 실시간 렌더링이 진화했습니다! 광선을 기반으로 한 혁신적인 3차원 재구성 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











StableDiffusion3의 논문이 드디어 나왔습니다! 이 모델은 2주 전에 출시되었으며 Sora와 동일한 DiT(DiffusionTransformer) 아키텍처를 사용합니다. 출시되자마자 큰 화제를 불러일으켰습니다. 이전 버전과 비교하여 StableDiffusion3에서 생성된 이미지의 품질이 크게 향상되었습니다. 이제 다중 테마 프롬프트를 지원하고 텍스트 쓰기 효과도 향상되었으며 더 이상 잘못된 문자가 표시되지 않습니다. StabilityAI는 StableDiffusion3이 800M에서 8B 범위의 매개변수 크기를 가진 일련의 모델임을 지적했습니다. 이 매개변수 범위는 모델이 많은 휴대용 장치에서 직접 실행될 수 있어 AI 사용이 크게 줄어든다는 것을 의미합니다.

첫 번째 파일럿 및 주요 기사에서는 주로 자율 주행 기술에서 일반적으로 사용되는 여러 좌표계를 소개하고 이들 간의 상관 관계 및 변환을 완료하고 최종적으로 통합 환경 모델을 구축하는 방법을 소개합니다. 여기서 초점은 차량에서 카메라 강체로의 변환(외부 매개변수), 카메라에서 이미지로의 변환(내부 매개변수), 이미지에서 픽셀 단위로의 변환을 이해하는 것입니다. 3D에서 2D로의 변환에는 해당 왜곡, 변환 등이 포함됩니다. 요점: 차량 좌표계와 카메라 본체 좌표계를 다시 작성해야 합니다. 평면 좌표계와 픽셀 좌표계 난이도: 이미지 평면에서 왜곡 제거와 왜곡 추가를 모두 고려해야 합니다. 2. 소개 좌표계에는 픽셀 평면 좌표계(u, v), 이미지 좌표계(x, y), 카메라 좌표계(), 월드 좌표계() 등 총 4가지 비전 시스템이 있습니다. 각 좌표계 사이에는 관계가 있으며,

자율주행 궤적 예측은 차량의 주행 과정에서 발생하는 다양한 데이터를 분석하여 차량의 향후 주행 궤적을 예측하는 것을 의미합니다. 자율주행의 핵심 모듈인 궤도 예측의 품질은 후속 계획 제어에 매우 중요합니다. 궤적 예측 작업은 풍부한 기술 스택을 보유하고 있으며 자율 주행 동적/정적 인식, 고정밀 지도, 차선, 신경망 아키텍처(CNN&GNN&Transformer) 기술 등에 대한 익숙함이 필요합니다. 시작하기가 매우 어렵습니다! 많은 팬들은 가능한 한 빨리 궤도 예측을 시작하여 함정을 피하기를 희망합니다. 오늘은 궤도 예측을 위한 몇 가지 일반적인 문제와 입문 학습 방법을 살펴보겠습니다. 관련 지식 입문 1. 미리보기 논문이 순서대로 되어 있나요? A: 먼저 설문조사를 보세요, p

본 논문에서는 자율 주행에서 다양한 시야각(예: 원근 및 조감도)에서 객체를 정확하게 감지하는 문제, 특히 원근(PV) 공간에서 조감(BEV) 공간으로 기능을 효과적으로 변환하는 방법을 탐구합니다. VT(Visual Transformation) 모듈을 통해 구현됩니다. 기존 방법은 크게 2D에서 3D로, 3D에서 2D로 변환하는 두 가지 전략으로 나뉩니다. 2D에서 3D로의 방법은 깊이 확률을 예측하여 조밀한 2D 특징을 개선하지만, 특히 먼 영역에서는 깊이 예측의 본질적인 불확실성으로 인해 부정확성이 발생할 수 있습니다. 3D에서 2D로의 방법은 일반적으로 3D 쿼리를 사용하여 2D 기능을 샘플링하고 Transformer를 통해 3D와 2D 기능 간의 대응에 대한 주의 가중치를 학습하므로 계산 및 배포 시간이 늘어납니다.

저자 개인 생각 중 일부 자율주행 분야에서는 BEV 기반의 하위 작업/End-to-End 솔루션 개발로 인해 고품질의 다시점 훈련 데이터와 그에 따른 시뮬레이션 장면 구축이 점점 더 중요해지고 있습니다. 현재 작업의 문제점에 대응하여 "고품질"은 세 가지 측면으로 분리될 수 있습니다. 다양한 차원의 롱테일 시나리오(예: 장애물 데이터의 근거리 차량 및 자동차 절단 과정의 정확한 방향 각도) 곡률이 다른 곡선이나 경사로/병합/병합 등 캡처하기 어려운 차선 데이터. 이는 종종 비용이 많이 드는 대량의 데이터 수집과 복잡한 데이터 마이닝 전략에 의존합니다. 3D 진정한 가치 - 매우 일관된 이미지: 현재 BEV 데이터 수집은 센서 설치/보정, 고정밀 지도 및 재구성 알고리즘 자체의 오류에 의해 영향을 받는 경우가 많습니다. 이것이 나를 이끌었다

갑자기 발견한 19년 된 논문 GSLAM: A General SLAM Framework and Benchmark 오픈소스 코드: https://github.com/zdzhaoyong/GSLAM 전문으로 직접 가서 이 작품의 퀄리티를 느껴보세요~1 Abstract SLAM technology 최근 많은 성공을 거두었으며 많은 첨단 기술 기업의 관심을 끌었습니다. 그러나 기존 또는 신흥 알고리즘에 대한 인터페이스를 사용하여 속도, 견고성 및 이식성에 대한 벤치마크를 효과적으로 수행하는 방법은 여전히 문제로 남아 있습니다. 본 논문에서는 평가 기능을 제공할 뿐만 아니라 연구자에게 자체 SLAM 시스템을 신속하게 개발할 수 있는 유용한 방법을 제공하는 GSLAM이라는 새로운 SLAM 플랫폼을 제안합니다.

이 네모난 남자는 눈앞에 있는 '불청객'의 정체를 고민하며 미간을 찌푸리고 있다는 점에 주목해주세요. 알고 보니 그녀는 위험한 상황에 처해 있었고, 이를 깨닫자마자 문제를 해결하기 위한 전략을 찾기 위해 재빨리 정신적 탐색을 시작했습니다. 결국 그녀는 현장을 떠나 가능한 한 빨리 도움을 구하고 즉각적인 조치를 취하기로 결정했습니다. 동시에 반대편에 있는 사람도 그녀와 같은 생각을 하고 있었는데... <마인크래프트>에도 모든 캐릭터가 인공지능에 의해 조종되는 장면이 있었다. 예를 들어 앞서 언급한 소녀는 17세지만 똑똑하고 용감한 택배기사입니다. 그들은 마인크래프트를 배경으로 한 이 작은 마을에서 인간처럼 기억하고 생각하며 살아갈 수 있는 능력을 가지고 있습니다. 그들을 움직이는 것은 아주 새로운 것입니다.

9월 23일, 국립방위기술대학교, JD.com 및 베이징 공과대학이 "DeepModelFusion:ASurvey"라는 논문을 발표했습니다. 딥 모델 융합/병합은 여러 딥 러닝 모델의 매개변수나 예측을 단일 모델로 결합하는 새로운 기술입니다. 이는 더 나은 성능을 위해 개별 모델의 편향과 오류를 보상하기 위해 다양한 모델의 기능을 결합합니다. 대규모 딥 러닝 모델(예: LLM 및 기본 모델)에 대한 딥 모델 융합은 높은 계산 비용, 고차원 매개변수 공간, 서로 다른 이종 모델 간의 간섭 등을 포함한 몇 가지 문제에 직면합니다. 이 기사에서는 기존 심층 모델 융합 방법을 네 가지 범주로 나눕니다. (1) 더 나은 초기 모델 융합을 얻기 위해 손실 감소 경로를 통해 가중치 공간의 솔루션을 연결하는 "패턴 연결"
