목차
논문 아이디어:
네트워크 설계:
실험 결과:
기술 주변기기 일체 포함 SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

Feb 20, 2024 am 11:48 AM
자율주행 예측하다

원제: SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving

논문 링크: https://arxiv.org/pdf/2402.02519.pdf

코드 링크: https://github.com /HKUST-Aerial-Robotics/SIMPL

저자 소속: 홍콩 과학기술대학교 DJI

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

논문 아이디어:

이 논문은 자율주행 차량을 위한 간단하고 효율적인 모션 예측 기준선(SIMPL)을 제안합니다. 정확도는 높지만 반복 계산이 필요한 기존의 에이전트 중심 방법 및 정확도와 일반성이 저하되는 장면 중심 방법과 달리 SIMPL은 모든 관련 트래픽에 대한 포괄적인 솔루션을 제공할 수 있으며 참가자는 실시간으로 정확한 움직임 예측을 제공할 수 있습니다. 정확성과 추론 속도를 향상시키기 위해 본 논문에서는 대칭 방식으로 지향성 메시지 전달을 수행하여 네트워크가 단일 피드포워드 패스에서 모든 도로 사용자의 미래 움직임을 예측할 수 있도록 하는 작고 효율적인 전역 특징 융합 모듈을 제안하고 정확도를 낮춥니다. 시점 이동으로 인한 손실. 또한 이 문서에서는 궤적 디코딩에서 연속 궤적 매개변수화를 위해 Bernstein 기본 다항식을 사용하는 방법을 조사하여 원하는 시점에서 상태 및 고차 파생 상품을 평가할 수 있으며 이는 다운스트림 계획 작업에 유용합니다. 강력한 기준으로서 SIMPL은 Argoverse 1 및 2 모션 예측 벤치마크에서 다른 최첨단 방법에 비해 매우 경쟁력 있는 성능을 보여줍니다. 또한 경량 설계와 낮은 추론 대기 시간 덕분에 SIMPL은 확장성이 뛰어나고 실제 항공 배치에 유망합니다.

네트워크 설계:

주변 교통 참가자의 움직임을 예측하는 것은 특히 다운스트림 의사결정 및 계획 모듈에서 자율주행차에 매우 중요합니다. 의도와 궤적을 정확하게 예측하면 안전성과 승차감이 향상됩니다.

학습 기반 동작 예측에서 가장 중요한 주제 중 하나는 상황 표현입니다. 초기 방법은 일반적으로 주변 장면을 다중 채널 조감도 이미지 [1]-[4]로 표현했습니다. 대조적으로, 최근 연구에서는 지리적 좌표가 있는 포인트 세트 또는 폴리라인을 사용하여 위치와 형상에 주석을 추가하는 벡터화된 장면 표현 [5]-[13]을 점점 더 많이 채택하고 있습니다. 이를 통해 충실도가 향상되고 수용 필드가 확장됩니다. 그러나 래스터화된 표현과 벡터화된 표현 모두에 중요한 질문이 있습니다. 이러한 모든 요소에 대해 적절한 참조 프레임을 어떻게 선택해야 할까요? 간단한 접근 방식은 자율주행차 중심의 공유 좌표계(장면 중심) 내의 모든 인스턴스를 설명하고 좌표를 입력 기능으로 직접 사용하는 것입니다. 이를 통해 단일 피드포워드 패스에서 여러 대상 에이전트에 대한 예측을 할 수 있습니다[8, 14]. 그러나 전역 좌표를 입력으로 사용하면 일반적으로 단일 피드포워드 패스에서 여러 대상 에이전트에 대한 예측이 이루어집니다[8, 14]. 그러나 전역 좌표를 입력(종종 넓은 범위에 걸쳐 다양함)으로 사용하면 작업의 고유한 복잡성이 크게 악화되어 네트워크 성능이 저하되고 새로운 시나리오에 대한 적응성이 제한됩니다. 정확성과 견고성을 향상시키기 위한 일반적인 솔루션은 대상 에이전트의 현재 상태에 따라 장면 컨텍스트를 정규화하는 것입니다[5, 7, 10]-[13](에이전트 중심). 이는 각 대상 에이전트에 대해 정규화 프로세스 및 기능 인코딩을 반복적으로 수행해야 하므로 중복 계산을 희생하여 성능을 향상시켜야 함을 의미합니다. 따라서 관점 변화에 대한 견고성을 유지하면서 여러 객체의 특징을 효과적으로 인코딩할 수 있는 방법을 모색할 필요가 있습니다.

의사결정, 모션 계획 등 모션 예측의 다운스트림 모듈의 경우 미래 ​​위치를 고려해야 할 뿐만 아니라 방향, 속도 및 기타 고차 미분도 고려해야 합니다. 예를 들어, 주변 차량의 예측 방향은 미래 시공간 점유를 형성하는 데 핵심적인 역할을 하며, 이는 안전하고 강력한 모션 계획을 보장하는 핵심 요소입니다[15, 16]. 더욱이, 물리적 제약을 따르지 않고 독립적으로 고차 수량을 예측하면 일관되지 않은 예측 결과가 발생할 수 있습니다[17, 18]. 예를 들어 속도가 0이더라도 계획 모듈을 혼란스럽게 하는 위치 변위가 발생할 수 있습니다.

이 글에서는 자율주행 시스템에서 다중 에이전트 궤적 예측의 핵심 문제를 해결하기 위한 SIMPL(Simple and Efficient Motion Prediction Baseline)이라는 방법을 소개합니다. 이 방법은 먼저 인스턴스 중심 장면 표현을 채택한 다음 원근 불변성에 대한 정확성과 견고성을 유지하면서 단일 피드포워드 패스에서 모든 에이전트의 궤적을 효과적으로 예측할 수 있는 SFT(Symmetric Fusion Transformer) 기술을 도입합니다. 대칭형 컨텍스트 융합을 기반으로 하는 다른 방법과 비교할 때 SFT는 더 간단하고 가벼우며 구현이 더 쉬워 차량 환경에 배포하는 데 적합합니다.

두 번째로, 이 논문에서는 번스타인 기반 다항식(베지어 곡선이라고도 함)을 기반으로 예측 궤적에 대한 새로운 매개변수화 방법을 소개합니다. 이러한 연속적인 표현은 매끄러움을 보장하고 특정 시점에서 정확한 상태와 고차 도함수를 쉽게 평가할 수 있게 해줍니다. 본 논문의 실증적 연구는 베지어 곡선의 제어점을 예측하는 방법을 학습하는 것이 단항 기저 다항식의 계수를 추정하는 것보다 더 효율적이고 수치적으로 안정적이라는 것을 보여줍니다.

마지막으로 제안된 구성 요소는 간단하면서도 효율적인 모델에 잘 통합됩니다. 본 논문은 두 개의 대규모 모션 예측 데이터세트[22, 23]에 대해 제안된 방법을 평가하고, 실험 결과는 SIMPL이 단순화된 설계에도 불구하고 다른 최첨단 방법에 비해 매우 경쟁력이 있음을 보여줍니다. 더 중요한 것은 SIMPL을 사용하면 실제 항공 배치에 유망한 정량화 성능을 희생하지 않고도 학습 가능한 매개 변수가 적고 추론 대기 시간이 낮아 효율적인 다중 에이전트 궤적 예측이 가능하다는 것입니다. 또한 이 백서는 강력한 기준으로서 SIMPL이 확장성이 높다는 점을 강조합니다. 단순한 아키텍처는 모션 예측의 최신 발전과 직접 통합을 촉진하여 전반적인 성능을 더욱 향상시킬 수 있는 기회를 제공합니다.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 1: 복잡한 운전 시나리오에서의 다중 에이전트 모션 예측 그림. 우리의 접근 방식은 모든 관련 에이전트에 대한 합리적인 가설을 실시간으로 동시에 생성할 수 있습니다. 자신의 차량과 다른 차량은 각각 빨간색과 파란색으로 표시됩니다. 그라데이션 색상을 사용하여 타임스탬프를 기반으로 예측된 ​​궤적을 시각화합니다. 더 많은 예시는 첨부된 영상을 참고해주세요.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 2: SIMPL 회로도. 이 기사에서는 가능한 가장 간단한 네트워크 아키텍처를 사용하여 그 효율성을 보여줍니다. 의미 인스턴스의 로컬 기능은 간단한 인코더로 처리되는 반면 인스턴스 간 기능은 상대 위치 임베딩에 보존됩니다. 다중 모드 궤적 예측 결과는 제안된 대칭 특징 변환기 이후의 모션 디코더에 의해 생성됩니다.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 3: 상대 포즈 계산의 개략도.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 4: 제안된 L층 대칭 융합 변압기(SFT)의 그림. 인스턴스 토큰과 상대 위치 임베딩(RPE)은 각 SFT 계층에서 주기적으로 업데이트됩니다.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 5: 2D 패혈증 베지어 곡선(왼쪽).

실험 결과:

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

요약:

이 글에서는 간단하고 효율적인 자율주행 멀티 에이전트 동작 예측을 위한 목적 기준입니다. 제안된 방법은 제안된 대칭 융합 변환기를 활용하여 효율적인 전역 특징 융합을 달성하고 시점 이동에 대한 강인성을 유지합니다. Bernstein 기반 다항식을 기반으로 한 연속 궤적 매개변수화는 다운스트림 모듈과의 더 높은 호환성을 제공합니다. 대규모 공개 데이터세트에 대한 실험 결과에 따르면 SIMPL은 다른 최첨단 방법과 동일한 수준의 정확도를 달성하면서 모델 크기와 추론 속도 측면에서 이점이 있는 것으로 나타났습니다.

인용:

Zhang L, Li P, Liu S, 외 SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 기준[J] arXiv 사전 인쇄 arXiv:2402.02519, 2024.

위 내용은 SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

자율주행 분야에서 Gaussian Splatting이 인기를 끌면서 NeRF가 폐기되기 시작한 이유는 무엇입니까? 자율주행 분야에서 Gaussian Splatting이 인기를 끌면서 NeRF가 폐기되기 시작한 이유는 무엇입니까? Jan 17, 2024 pm 02:57 PM

위에 작성됨 및 저자의 개인적인 이해 3DGS(3차원 가우스플래팅)는 최근 몇 년간 명시적 방사선장 및 컴퓨터 그래픽 분야에서 등장한 혁신적인 기술입니다. 이 혁신적인 방법은 수백만 개의 3D 가우스를 사용하는 것이 특징이며, 이는 주로 암시적 좌표 기반 모델을 사용하여 공간 좌표를 픽셀 값에 매핑하는 NeRF(Neural Radiation Field) 방법과 매우 다릅니다. 명시적인 장면 표현과 미분 가능한 렌더링 알고리즘을 갖춘 3DGS는 실시간 렌더링 기능을 보장할 뿐만 아니라 전례 없는 수준의 제어 및 장면 편집 기능을 제공합니다. 이는 3DGS를 차세대 3D 재구성 및 표현을 위한 잠재적인 게임 체인저로 자리매김합니다. 이를 위해 우리는 처음으로 3DGS 분야의 최신 개발 및 관심사에 대한 체계적인 개요를 제공합니다.

자율주행 시나리오에서 롱테일 문제를 해결하는 방법은 무엇입니까? 자율주행 시나리오에서 롱테일 문제를 해결하는 방법은 무엇입니까? Jun 02, 2024 pm 02:44 PM

어제 인터뷰 도중 롱테일 관련 질문을 해본 적이 있느냐는 질문을 받아서 간략하게 요약해볼까 생각했습니다. 자율주행의 롱테일 문제는 자율주행차의 엣지 케이스, 즉 발생 확률이 낮은 가능한 시나리오를 말한다. 인지된 롱테일 문제는 현재 단일 차량 지능형 자율주행차의 운영 설계 영역을 제한하는 주요 이유 중 하나입니다. 자율주행의 기본 아키텍처와 대부분의 기술적인 문제는 해결되었으며, 나머지 5%의 롱테일 문제는 점차 자율주행 발전을 제한하는 핵심이 되었습니다. 이러한 문제에는 다양한 단편적인 시나리오, 극단적인 상황, 예측할 수 없는 인간 행동이 포함됩니다. 자율 주행에서 엣지 시나리오의 "롱테일"은 자율주행차(AV)의 엣지 케이스를 의미하며 발생 확률이 낮은 가능한 시나리오입니다. 이런 희귀한 사건

카메라 또는 LiDAR를 선택하시겠습니까? 강력한 3D 객체 감지 달성에 대한 최근 검토 카메라 또는 LiDAR를 선택하시겠습니까? 강력한 3D 객체 감지 달성에 대한 최근 검토 Jan 26, 2024 am 11:18 AM

0. 전면 작성&& 자율주행 시스템은 다양한 센서(예: 카메라, 라이더, 레이더 등)를 사용하여 주변 환경을 인식하고 알고리즘과 모델을 사용하는 고급 인식, 의사결정 및 제어 기술에 의존한다는 개인적인 이해 실시간 분석과 의사결정을 위해 이를 통해 차량은 도로 표지판을 인식하고, 다른 차량을 감지 및 추적하며, 보행자 행동을 예측하는 등 복잡한 교통 환경에 안전하게 작동하고 적응할 수 있게 되므로 현재 널리 주목받고 있으며 미래 교통의 중요한 발전 분야로 간주됩니다. . 하나. 하지만 자율주행을 어렵게 만드는 것은 자동차가 주변에서 일어나는 일을 어떻게 이해할 수 있는지 알아내는 것입니다. 이를 위해서는 자율주행 시스템의 3차원 객체 감지 알고리즘이 주변 환경의 객체의 위치를 ​​포함하여 정확하게 인지하고 묘사할 수 있어야 하며,

시계열 확률 예측을 위한 분위수 회귀 시계열 확률 예측을 위한 분위수 회귀 May 07, 2024 pm 05:04 PM

원본 내용의 의미를 바꾸지 말고 내용을 미세 조정하고 내용을 다시 작성하고 계속하지 마십시오. "분위수 회귀는 이러한 요구를 충족하여 정량화된 확률로 예측 구간을 제공합니다. 이는 특히 응답 변수의 조건부 분포에 관심이 있는 경우 예측 변수와 응답 변수 간의 관계를 모델링하는 데 사용되는 통계 기술입니다. 기존 회귀와 달리 분위수 회귀는 조건부 평균보다는 반응 변수의 조건부 크기를 추정하는 데 중점을 둡니다. "그림 (A): 분위수 회귀 분위수 회귀의 개념은 추정입니다. 회귀 변수 집합 X와 설명된 변수 Y의 분위수. 기존 회귀모형은 실제로 설명변수와 설명변수의 관계를 연구하기 위한 방법이다. 그들은 설명 변수와 설명 변수 사이의 관계에 중점을 둡니다.

자율주행과 궤도예측에 관한 글은 이 글이면 충분합니다! 자율주행과 궤도예측에 관한 글은 이 글이면 충분합니다! Feb 28, 2024 pm 07:20 PM

자율주행 궤적 예측은 차량의 주행 과정에서 발생하는 다양한 데이터를 분석하여 차량의 향후 주행 궤적을 예측하는 것을 의미합니다. 자율주행의 핵심 모듈인 궤도 예측의 품질은 후속 계획 제어에 매우 중요합니다. 궤적 예측 작업은 풍부한 기술 스택을 보유하고 있으며 자율 주행 동적/정적 인식, 고정밀 지도, 차선, 신경망 아키텍처(CNN&GNN&Transformer) 기술 등에 대한 익숙함이 필요합니다. 시작하기가 매우 어렵습니다! 많은 팬들은 가능한 한 빨리 궤도 예측을 시작하여 함정을 피하기를 희망합니다. 오늘은 궤도 예측을 위한 몇 가지 일반적인 문제와 입문 학습 방법을 살펴보겠습니다. 관련 지식 입문 1. 미리보기 논문이 순서대로 되어 있나요? A: 먼저 설문조사를 보세요, p

엔드투엔드(End-to-End)와 차세대 자율주행 시스템, 그리고 엔드투엔드 자율주행에 대한 몇 가지 오해에 대해 이야기해볼까요? 엔드투엔드(End-to-End)와 차세대 자율주행 시스템, 그리고 엔드투엔드 자율주행에 대한 몇 가지 오해에 대해 이야기해볼까요? Apr 15, 2024 pm 04:13 PM

지난 달에는 몇 가지 잘 알려진 이유로 업계의 다양한 교사 및 급우들과 매우 집중적인 교류를 가졌습니다. 교환에서 피할 수 없는 주제는 자연스럽게 엔드투엔드와 인기 있는 Tesla FSDV12입니다. 저는 이 기회를 빌어 여러분의 참고와 토론을 위해 지금 이 순간 제 생각과 의견을 정리하고 싶습니다. End-to-End 자율주행 시스템을 어떻게 정의하고, End-to-End 해결을 위해 어떤 문제가 예상되나요? 가장 전통적인 정의에 따르면, 엔드 투 엔드 시스템은 센서로부터 원시 정보를 입력하고 작업과 관련된 변수를 직접 출력하는 시스템을 의미합니다. 예를 들어 이미지 인식에서 CNN은 기존의 특징 추출 + 분류기 방식에 비해 end-to-end 방식으로 호출할 수 있습니다. 자율주행 작업에서는 다양한 센서(카메라/LiDAR)로부터 데이터를 입력받아

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크 SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크 Feb 20, 2024 am 11:48 AM

원제목: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving 논문 링크: https://arxiv.org/pdf/2402.02519.pdf 코드 링크: https://github.com/HKUST-Aerial-Robotics/SIMPL 저자 단위: Hong Kong University of Science 및 기술 DJI 논문 아이디어: 이 논문은 자율주행차를 위한 간단하고 효율적인 모션 예측 기준선(SIMPL)을 제안합니다. 기존 에이전트 센트와 비교

FisheyeDetNet: 어안 카메라를 기반으로 한 최초의 표적 탐지 알고리즘 FisheyeDetNet: 어안 카메라를 기반으로 한 최초의 표적 탐지 알고리즘 Apr 26, 2024 am 11:37 AM

표적 탐지는 자율주행 시스템에서 상대적으로 성숙한 문제이며, 그 중 보행자 탐지는 가장 먼저 배포되는 알고리즘 중 하나입니다. 대부분의 논문에서 매우 포괄적인 연구가 수행되었습니다. 그러나 서라운드 뷰를 위한 어안 카메라를 사용한 거리 인식은 상대적으로 덜 연구되었습니다. 큰 방사형 왜곡으로 인해 표준 경계 상자 표현은 어안 카메라에서 구현하기 어렵습니다. 위의 설명을 완화하기 위해 확장된 경계 상자, 타원 및 일반 다각형 디자인을 극/각 표현으로 탐색하고 인스턴스 분할 mIOU 메트릭을 정의하여 이러한 표현을 분석합니다. 제안된 다각형 형태의 모델 fisheyeDetNet은 다른 모델보다 성능이 뛰어나며 동시에 자율 주행을 위한 Valeo fisheye 카메라 데이터 세트에서 49.5% mAP를 달성합니다.

See all articles