워크샵 홈페이지: https://www.php.cn/link/f73850aa36d8564629a0d62c51009acf
개요
이 세미나는 현재 가장 발전된 자율 주행 기술과 포괄적이고 신뢰할 수 있는 지능형 자율 주행 간의 격차에 대해 논의하는 것을 목표로 합니다. 자치령 대표. 최근 몇 년 동안 대규모 다중 모드 모델(예: GPT-4V)은 다중 모드 인식 및 이해에 있어 전례 없는 발전을 보여주었습니다. MLLM을 사용하여 자율 주행의 복잡한 시나리오, 특히 드물지만 중요한 하드 케이스 시나리오를 처리하는 것은 해결되지 않은 과제입니다. 이 워크숍은 다중 모드 대형 모델 인식 및 이해, 자율 주행 시스템에 첨단 AIGC 기술 적용, 엔드투엔드 자율 주행에 대한 혁신적인 연구를 촉진하는 것을 목표로 합니다.
워크숍논문 모집
이 초안 논문은 자율 주행 장면에 대한 다중 모달 인식 및 이해, 자율 주행 장면의 이미지 및 비디오 생성, 엔드 투 엔드 자율 주행 및 차세대와 같은 주제에 중점을 둡니다. -세대 산업용 자율 주행 솔루션:
제출 규칙:
이 제출물은 OpenReview를 통해 이중 맹검 검토를 거칩니다. 플랫폼에 제출하며 두 가지 형태의 제출이 허용됩니다.
제출 입구:
자율의 어려운 예 운전 장면 멀티모달 이해 및 영상 생성 챌린지
본 대회는 멀티모달 모델을 통해 자율주행의 극한 상황에 대한 인식과 이해를 향상시키고, 이러한 극한 상황을 묘사하는 능력을 기르는 것을 목표로 합니다. 푸짐한 상품과 보너스를 드리며, 여러분의 많은 참여를 진심으로 초대합니다!
트랙 1: 어려운 자율 주행 시나리오에 대한 인식 및 이해
이 트랙은 전반적인 장면 이해, 지역적 이해 및 역량을 포함하여 어려운 자율 주행 시나리오에서 MLLM(다중 모드 대형 모델)의 인식 및 이해 기능에 중점을 둡니다. 운전 추천과 같은 것은 보다 신뢰할 수 있고 설명 가능한 자율 주행 에이전트의 개발을 촉진하도록 설계되었습니다.
트랙 2: 어려운 자율 주행 시나리오의 비디오 생성
이 트랙은 다중 뷰 자율 주행 장면 비디오를 생성하는 확산 모델의 기능에 중점을 둡니다. 자율 주행 장면의 주어진 3D 기하학적 구조를 기반으로 모델은 해당 자율 주행 장면 비디오를 생성하고 타이밍 일관성, 다중 뷰 일관성, 지정된 해상도 및 비디오 지속 시간을 보장해야 합니다.
대회 기간: 2024년 6월 15일 ~ 2024년 8월 15일
상금 설정: 우승 1,000달러, 준우승 800달러, 3위 600달러(트랙당)
시간 노드( AoE Time, UTC-12)
전체 논문 제출 | ||
전체 논문 제출 마감 |
1 st 8월 , 2024 |
|
저자에게 전체 문서 알림 |
10th 2024년 8월 |
|
전체 문서 카메라 준비 마감 |
15th 2024년 8월 |
|
초록 논문 제출 ㅋㅋㅋ | 7||
|
추상 종이 카메라 준비 마감 | 10|
챌린지
|
||
챌린지 공개 | 15 | th 6월 챌린지 당첨자 공지 2024년 | 1
|
||
30 th | 2024년 9월 ||
워크숍과 챌린지에 대해 질문이 있는 경우 | 연락처: w-coda2024@googlegroups.com 으로 이메일을 보내주세요. |
위 내용은 ECCV 2024 워크숍 다중 모드 이해 및 자율 주행 어려운 시나리오의 비디오 생성 논문 모집 및 챌린지가 시작되었습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!