SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

WBOY
풀어 주다: 2024-02-20 11:48:22
앞으로
600명이 탐색했습니다.

원제: SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving

논문 링크: https://arxiv.org/pdf/2402.02519.pdf

코드 링크: https://github.com /HKUST-Aerial-Robotics/SIMPL

저자 소속: 홍콩 과학기술대학교 DJI

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

논문 아이디어:

이 논문은 자율주행 차량을 위한 간단하고 효율적인 모션 예측 기준선(SIMPL)을 제안합니다. 정확도는 높지만 반복 계산이 필요한 기존의 에이전트 중심 방법 및 정확도와 일반성이 저하되는 장면 중심 방법과 달리 SIMPL은 모든 관련 트래픽에 대한 포괄적인 솔루션을 제공할 수 있으며 참가자는 실시간으로 정확한 움직임 예측을 제공할 수 있습니다. 정확성과 추론 속도를 향상시키기 위해 본 논문에서는 대칭 방식으로 지향성 메시지 전달을 수행하여 네트워크가 단일 피드포워드 패스에서 모든 도로 사용자의 미래 움직임을 예측할 수 있도록 하는 작고 효율적인 전역 특징 융합 모듈을 제안하고 정확도를 낮춥니다. 시점 이동으로 인한 손실. 또한 이 문서에서는 궤적 디코딩에서 연속 궤적 매개변수화를 위해 Bernstein 기본 다항식을 사용하는 방법을 조사하여 원하는 시점에서 상태 및 고차 파생 상품을 평가할 수 있으며 이는 다운스트림 계획 작업에 유용합니다. 강력한 기준으로서 SIMPL은 Argoverse 1 및 2 모션 예측 벤치마크에서 다른 최첨단 방법에 비해 매우 경쟁력 있는 성능을 보여줍니다. 또한 경량 설계와 낮은 추론 대기 시간 덕분에 SIMPL은 확장성이 뛰어나고 실제 항공 배치에 유망합니다.

네트워크 설계:

주변 교통 참가자의 움직임을 예측하는 것은 특히 다운스트림 의사결정 및 계획 모듈에서 자율주행차에 매우 중요합니다. 의도와 궤적을 정확하게 예측하면 안전성과 승차감이 향상됩니다.

학습 기반 동작 예측에서 가장 중요한 주제 중 하나는 상황 표현입니다. 초기 방법은 일반적으로 주변 장면을 다중 채널 조감도 이미지 [1]-[4]로 표현했습니다. 대조적으로, 최근 연구에서는 지리적 좌표가 있는 포인트 세트 또는 폴리라인을 사용하여 위치와 형상에 주석을 추가하는 벡터화된 장면 표현 [5]-[13]을 점점 더 많이 채택하고 있습니다. 이를 통해 충실도가 향상되고 수용 필드가 확장됩니다. 그러나 래스터화된 표현과 벡터화된 표현 모두에 중요한 질문이 있습니다. 이러한 모든 요소에 대해 적절한 참조 프레임을 어떻게 선택해야 할까요? 간단한 접근 방식은 자율주행차 중심의 공유 좌표계(장면 중심) 내의 모든 인스턴스를 설명하고 좌표를 입력 기능으로 직접 사용하는 것입니다. 이를 통해 단일 피드포워드 패스에서 여러 대상 에이전트에 대한 예측을 할 수 있습니다[8, 14]. 그러나 전역 좌표를 입력으로 사용하면 일반적으로 단일 피드포워드 패스에서 여러 대상 에이전트에 대한 예측이 이루어집니다[8, 14]. 그러나 전역 좌표를 입력(종종 넓은 범위에 걸쳐 다양함)으로 사용하면 작업의 고유한 복잡성이 크게 악화되어 네트워크 성능이 저하되고 새로운 시나리오에 대한 적응성이 제한됩니다. 정확성과 견고성을 향상시키기 위한 일반적인 솔루션은 대상 에이전트의 현재 상태에 따라 장면 컨텍스트를 정규화하는 것입니다[5, 7, 10]-[13](에이전트 중심). 이는 각 대상 에이전트에 대해 정규화 프로세스 및 기능 인코딩을 반복적으로 수행해야 하므로 중복 계산을 희생하여 성능을 향상시켜야 함을 의미합니다. 따라서 관점 변화에 대한 견고성을 유지하면서 여러 객체의 특징을 효과적으로 인코딩할 수 있는 방법을 모색할 필요가 있습니다.

의사결정, 모션 계획 등 모션 예측의 다운스트림 모듈의 경우 미래 ​​위치를 고려해야 할 뿐만 아니라 방향, 속도 및 기타 고차 미분도 고려해야 합니다. 예를 들어, 주변 차량의 예측 방향은 미래 시공간 점유를 형성하는 데 핵심적인 역할을 하며, 이는 안전하고 강력한 모션 계획을 보장하는 핵심 요소입니다[15, 16]. 더욱이, 물리적 제약을 따르지 않고 독립적으로 고차 수량을 예측하면 일관되지 않은 예측 결과가 발생할 수 있습니다[17, 18]. 예를 들어 속도가 0이더라도 계획 모듈을 혼란스럽게 하는 위치 변위가 발생할 수 있습니다.

이 글에서는 자율주행 시스템에서 다중 에이전트 궤적 예측의 핵심 문제를 해결하기 위한 SIMPL(Simple and Efficient Motion Prediction Baseline)이라는 방법을 소개합니다. 이 방법은 먼저 인스턴스 중심 장면 표현을 채택한 다음 원근 불변성에 대한 정확성과 견고성을 유지하면서 단일 피드포워드 패스에서 모든 에이전트의 궤적을 효과적으로 예측할 수 있는 SFT(Symmetric Fusion Transformer) 기술을 도입합니다. 대칭형 컨텍스트 융합을 기반으로 하는 다른 방법과 비교할 때 SFT는 더 간단하고 가벼우며 구현이 더 쉬워 차량 환경에 배포하는 데 적합합니다.

두 번째로, 이 논문에서는 번스타인 기반 다항식(베지어 곡선이라고도 함)을 기반으로 예측 궤적에 대한 새로운 매개변수화 방법을 소개합니다. 이러한 연속적인 표현은 매끄러움을 보장하고 특정 시점에서 정확한 상태와 고차 도함수를 쉽게 평가할 수 있게 해줍니다. 본 논문의 실증적 연구는 베지어 곡선의 제어점을 예측하는 방법을 학습하는 것이 단항 기저 다항식의 계수를 추정하는 것보다 더 효율적이고 수치적으로 안정적이라는 것을 보여줍니다.

마지막으로 제안된 구성 요소는 간단하면서도 효율적인 모델에 잘 통합됩니다. 본 논문은 두 개의 대규모 모션 예측 데이터세트[22, 23]에 대해 제안된 방법을 평가하고, 실험 결과는 SIMPL이 단순화된 설계에도 불구하고 다른 최첨단 방법에 비해 매우 경쟁력이 있음을 보여줍니다. 더 중요한 것은 SIMPL을 사용하면 실제 항공 배치에 유망한 정량화 성능을 희생하지 않고도 학습 가능한 매개 변수가 적고 추론 대기 시간이 낮아 효율적인 다중 에이전트 궤적 예측이 가능하다는 것입니다. 또한 이 백서는 강력한 기준으로서 SIMPL이 확장성이 높다는 점을 강조합니다. 단순한 아키텍처는 모션 예측의 최신 발전과 직접 통합을 촉진하여 전반적인 성능을 더욱 향상시킬 수 있는 기회를 제공합니다.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 1: 복잡한 운전 시나리오에서의 다중 에이전트 모션 예측 그림. 우리의 접근 방식은 모든 관련 에이전트에 대한 합리적인 가설을 실시간으로 동시에 생성할 수 있습니다. 자신의 차량과 다른 차량은 각각 빨간색과 파란색으로 표시됩니다. 그라데이션 색상을 사용하여 타임스탬프를 기반으로 예측된 ​​궤적을 시각화합니다. 더 많은 예시는 첨부된 영상을 참고해주세요.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 2: SIMPL 회로도. 이 기사에서는 가능한 가장 간단한 네트워크 아키텍처를 사용하여 그 효율성을 보여줍니다. 의미 인스턴스의 로컬 기능은 간단한 인코더로 처리되는 반면 인스턴스 간 기능은 상대 위치 임베딩에 보존됩니다. 다중 모드 궤적 예측 결과는 제안된 대칭 특징 변환기 이후의 모션 디코더에 의해 생성됩니다.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 3: 상대 포즈 계산의 개략도.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 4: 제안된 L층 대칭 융합 변압기(SFT)의 그림. 인스턴스 토큰과 상대 위치 임베딩(RPE)은 각 SFT 계층에서 주기적으로 업데이트됩니다.

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

그림 5: 2D 패혈증 베지어 곡선(왼쪽).

실험 결과:

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크

요약:

이 글에서는 간단하고 효율적인 자율주행 멀티 에이전트 동작 예측을 위한 목적 기준입니다. 제안된 방법은 제안된 대칭 융합 변환기를 활용하여 효율적인 전역 특징 융합을 달성하고 시점 이동에 대한 강인성을 유지합니다. Bernstein 기반 다항식을 기반으로 한 연속 궤적 매개변수화는 다운스트림 모듈과의 더 높은 호환성을 제공합니다. 대규모 공개 데이터세트에 대한 실험 결과에 따르면 SIMPL은 다른 최첨단 방법과 동일한 수준의 정확도를 달성하면서 모델 크기와 추론 속도 측면에서 이점이 있는 것으로 나타났습니다.

인용:

Zhang L, Li P, Liu S, 외 SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 기준[J] arXiv 사전 인쇄 arXiv:2402.02519, 2024.

위 내용은 SIMPL: 자율 주행을 위한 간단하고 효율적인 다중 에이전트 동작 예측 벤치마크의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿