기술 주변기기 일체 포함 반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

Apr 08, 2023 pm 07:11 PM
지능적인 데이터세트

arXiv 논문 "Ithaca365: 반복적이고 까다로운 기상 조건 하에서의 데이터 세트 및 운전 인식"(22년 8월 1일 업로드)은 코넬 대학과 오하이오 주립 대학의 연구입니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

최근에는 특정 위치와 좋은 날씨 조건에서 수집되는 대규모 데이터 세트의 사용으로 인해 자율주행차의 인식 능력이 향상되었습니다. 그러나 높은 안전 요구 사항을 충족하려면 이러한 감지 시스템이 눈과 비를 비롯한 다양한 기상 조건에서 견고하게 작동해야 합니다.

이 기사에서는 다양한 시나리오(도시, 고속도로, 농촌 지역, 캠퍼스), 날씨(눈, 비, 태양), 시간(요일)에서 새로운 데이터 수집 프로세스를 사용하여 강력한 자율 주행을 달성하기 위한 데이터 세트를 제안합니다. /야간) ) 및 교통 상황(보행자, 자전거 이용자 및 자동차), 데이터는 15km 경로를 따라 반복적으로 기록되었습니다.

이 데이터 세트에는 카메라와 LiDAR 센서의 이미지와 포인트 클라우드는 물론 경로 전반에 걸쳐 통신을 설정하는 고정밀 GPS/INS가 포함되어 있습니다. 데이터 세트에는 도로 및 객체 주석, 로컬 폐색, 아모달 마스크로 캡처된 3D 경계 상자가 포함됩니다.

반복 경로는 표적 발견, 지속적인 학습 및 이상 탐지를 위한 새로운 연구 방향을 열어줍니다.

Ithaca365 링크: 새로운 데이터 수집 프로세스를 통해 강력한 자율 주행을 가능하게 하는 새로운 데이터 세트

사진은 데이터 수집을 위한 센서 구성:

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

사진 a는 여러 위치에서 캡처한 로드맵을 보여줍니다. 드라이브는 밤을 포함하여 하루 중 다양한 시간에 데이터를 수집하도록 예약되었습니다. 도로 청소 전후의 폭설 상황을 기록합니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

데이터세트의 주요 특징은 동일한 위치가 다른 조건에서 관찰될 수 있다는 것입니다. 예가 그림 b에 나와 있습니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

그림은 다양한 조건에서의 순회 구문 분석을 보여줍니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식


도로 및 대상의 비모달 마스크를 얻기 위한 사용자 정의 표시 도구를 개발합니다. 눈 덮인 도로와 같이 다양한 환경 조건의 도로 라벨의 경우 동일한 경로의 반복 횡단을 사용합니다. 구체적으로 GPS 자세와 LiDAR 데이터로 구성된 포인트 클라우드 로드맵은 "날씨 좋음"이라는 도로 라벨을 "나쁜 날씨"로 변환합니다.

경로/데이터는 76개의 간격으로 구분됩니다. 포인트 클라우드를 BEV에 투영하고 다각형 주석자를 사용하여 도로에 레이블을 지정합니다. 도로가 BEV(2차원 도로 경계 생성)에 표시되면 다각형은 평균 높이 1.5m의 임계값을 사용하여 더 작은 150m^2 다각형으로 분해되고 평면 맞춤이 다각형 내의 점에 수행됩니다. 도로 높이를 결정하는 경계.

RANSAC 및 회귀 분석기를 사용하여 이러한 점에 평면을 맞춘 다음 추정된 지상 평면을 사용하여 경계를 따라 각 점의 높이를 계산합니다. 도로 점을 이미지에 투영하고 깊이 마스크를 생성하여 도로의 비모달 레이블을 얻습니다. GPS를 사용하여 표시된 지도와 위치를 일치시키고 ICP를 사용하여 경로를 최적화하면 지상 평면을 새 수집 경로의 특정 위치에 투영할 수 있습니다.

도로 라벨의 평균 투영 지상 진실 마스크가 동일한 위치의 다른 모든 지상 진실 마스크와 80% mIOU를 준수하는지 확인하여 ICP 솔루션을 최종 확인합니다. 그렇지 않은 경우 쿼리 위치 데이터가 검색되지 않습니다.

Amodal 대상에는 자동차, 버스, 트럭(화물, 소방차, 픽업 트럭, 구급차 포함), 보행자, 자전거 타는 사람, 오토바이 타는 사람 등 6가지 전경 대상 범주에 대해 Scale AI 라벨이 지정되어 있습니다.

이 레이블 지정 패러다임에는 세 가지 주요 구성 요소가 있습니다. 먼저 개체의 보이는 인스턴스를 식별한 다음 가려진 인스턴스 분할 마스크를 추론하고 마지막으로 각 개체의 폐색 순서에 레이블을 지정합니다. 마킹은 가장 왼쪽의 전방 카메라 뷰에서 수행됩니다. KINS와 동일한 표준을 따릅니다(“Amodal 인스턴스 세분화를 kins 데이터세트”. CVPR, 2019).

데이터세트의 환경 다양성과 비모달 품질을 입증하기 위해 픽셀 수준에서 비모달 도로를 식별하도록 두 개의 기본 네트워크를 훈련하고 테스트했으며 도로가 눈이나 자동차로 덮여 있을 때에도 작동했습니다. 첫 번째 기본 네트워크는 SFI(Semantic Foreground Inpainting)입니다. 그림에 표시된 두 번째 기준선은 SFI를 개선하기 위해 다음 세 가지 혁신을 사용합니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

  1. 위치 및 채널 참고: 모달 분할은 주로 보이지 않는 것을 추론하기 때문에 컨텍스트가 매우 중요한 단서입니다. DAN(“Dual Attention Network for Scene Segmentation”, CVPR'2019)은 서로 다른 두 가지 배경을 포착하기 위해 두 가지 혁신을 도입했습니다. PAM(Position Attention Module)은 픽셀 기능을 사용하여 이미지의 다른 픽셀에 초점을 맞추고 실제로 이미지의 다른 부분에서 컨텍스트를 캡처합니다. CAM(Channel Attention Module)은 유사한 주의 메커니즘을 사용하여 채널 정보를 효율적으로 집계합니다. 여기서 이 두 모듈은 백본 기능 추출기에 적용됩니다. 미세한 마스크 경계의 더 나은 위치 파악을 위해 CAM과 PAM을 결합합니다. 최종 전경 인스턴스 마스크는 업샘플링 레이어를 통해 획득됩니다.
  2. 인페인팅으로서의 하이브리드 풀링: 최대 풀링은 겹치는 전경 특징을 가까운 배경 특징으로 대체하여 비모달 도로 특징을 복원하는 데 도움이 되는 인페인팅 작업으로 사용됩니다. 그러나 배경 기능은 일반적으로 원활하게 분산되므로 최대 풀링 작업은 추가된 노이즈에 매우 민감합니다. 대조적으로, 평균 풀링 작업은 자연스럽게 노이즈를 완화합니다. 이를 위해 평균 풀링(Average Pooling)과 최대 풀링(Maximum Pooling)을 결합하여 패치하는 것을 Mixture Pooling이라고 합니다.
  3. Sum 연산: 마지막 업샘플링 레이어 이전에 하이브리드 풀링 모듈의 기능이 직접 전달되지 않지만 PAM 모듈 출력의 잔여 링크가 포함됩니다. 도로 분할 분기에서 두 개의 특징 맵을 공동으로 최적화함으로써 PAM 모듈은 폐색된 영역의 배경 특징도 학습할 수 있습니다. 이렇게 하면 배경 기능을 보다 정확하게 복구할 수 있습니다.

그림은 PAM과 CAM의 아키텍처 다이어그램을 보여줍니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

하이브리드 풀링에 의한 패치를 위한 알고리즘 의사 코드는 다음과 같습니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

비모달 도로 분할을 위한 훈련 및 테스트 코드는 다음과 같습니다. https://github.com/coolgrasshopper/amodal_road_segmentation

실험 결과는 다음과 같습니다.

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식

반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식


위 내용은 반복적이고 까다로운 기상 조건에서의 데이터 세트 및 운전 인식의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Windows 11의 스마트 앱 제어: 켜거나 끄는 방법 Windows 11의 스마트 앱 제어: 켜거나 끄는 방법 Jun 06, 2023 pm 11:10 PM

지능형 앱 제어는 랜섬웨어나 스파이웨어와 같이 데이터를 손상시킬 수 있는 승인되지 않은 앱으로부터 PC를 보호하는 데 도움이 되는 Windows 11의 매우 유용한 도구입니다. 이 문서에서는 스마트 앱 컨트롤이 무엇인지, 어떻게 작동하는지, Windows 11에서 켜거나 끄는 방법을 설명합니다. Windows 11의 스마트 앱 제어란 무엇입니까? SAC(스마트 앱 제어)는 Windows 1122H2 업데이트에 도입된 새로운 보안 기능입니다. Microsoft Defender 또는 타사 바이러스 백신 소프트웨어와 함께 작동하여 장치 속도를 늦추거나 예상치 못한 광고를 표시하거나 기타 예상치 못한 작업을 수행할 수 있는 잠재적으로 불필요한 앱을 차단합니다. 스마트 애플리케이션

날아다니는 것, 입을 벌리는 것, 쳐다보는 것, 눈썹을 치켜올리는 것 등의 얼굴 특징을 AI가 완벽하게 모방할 수 있어 영상사기 예방이 불가능하다. 날아다니는 것, 입을 벌리는 것, 쳐다보는 것, 눈썹을 치켜올리는 것 등의 얼굴 특징을 AI가 완벽하게 모방할 수 있어 영상사기 예방이 불가능하다. Dec 14, 2023 pm 11:30 PM

이렇게 강력한 AI 모방 능력을 가지고 있다면, 막는 것은 사실상 불가능합니다. 이제 AI의 발전이 이 정도 수준에 이르렀나? 앞발은 이목구비를 날리게 하고, 뒷발은 쳐다보는 것, 눈썹을 치켜올리는 것, 삐죽이는 것 등 아무리 과장된 표정이라도 완벽하게 흉내낸다. 난이도를 높이고, 눈썹을 더 높이 올리고, 눈을 크게 뜨고, 입 모양까지 비뚤어지게 표현하는 등 가상 캐릭터 아바타가 표정을 완벽하게 재현할 수 있다. 왼쪽의 매개변수를 조정하면 오른쪽의 가상 아바타도 그에 따라 움직임을 변경하여 입과 눈을 클로즈업하여 모방이 완전히 동일하다고는 할 수 없으며 표정만 정확합니다. 마찬가지다(맨 오른쪽). 이 연구는 GaussianAvatars를 제안하는 뮌헨 기술 대학과 같은 기관에서 나왔습니다.

MotionLM: 다중 에이전트 모션 예측을 위한 언어 모델링 기술 MotionLM: 다중 에이전트 모션 예측을 위한 언어 모델링 기술 Oct 13, 2023 pm 12:09 PM

이 글은 자율주행하트 공개 계정의 허가를 받아 재인쇄되었습니다. 재인쇄를 원하시면 출처에 문의해 주세요. 원제: MotionLM: Multi-Agent Motion Forecasting as Language Modeling 논문 링크: https://arxiv.org/pdf/2309.16534.pdf 저자 소속: Waymo 컨퍼런스: ICCV2023 논문 아이디어: 자율 차량 안전 계획을 위해 미래 행동을 안정적으로 예측 도로요원의 역할이 중요합니다. 본 연구는 연속적인 궤적을 개별 모션 토큰의 시퀀스로 표현하고 다중 에이전트 모션 예측을 언어 모델링 작업으로 처리합니다. 우리가 제안하는 모델인 MotionLM은 다음과 같은 장점을 가지고 있습니다.

대형 모델에 대한 새로운 과학적이고 복잡한 질문 답변 벤치마크 및 평가 시스템을 제공하기 위해 UNSW, Argonne, University of Chicago 및 기타 기관이 공동으로 SciQAG 프레임워크를 출시했습니다. 대형 모델에 대한 새로운 과학적이고 복잡한 질문 답변 벤치마크 및 평가 시스템을 제공하기 위해 UNSW, Argonne, University of Chicago 및 기타 기관이 공동으로 SciQAG 프레임워크를 출시했습니다. Jul 25, 2024 am 06:42 AM

편집자 |ScienceAI 질문 응답(QA) 데이터 세트는 자연어 처리(NLP) 연구를 촉진하는 데 중요한 역할을 합니다. 고품질 QA 데이터 세트는 모델을 미세 조정하는 데 사용될 수 있을 뿐만 아니라 LLM(대형 언어 모델)의 기능, 특히 과학적 지식을 이해하고 추론하는 능력을 효과적으로 평가하는 데에도 사용할 수 있습니다. 현재 의학, 화학, 생물학 및 기타 분야를 포괄하는 과학적인 QA 데이터 세트가 많이 있지만 이러한 데이터 세트에는 여전히 몇 가지 단점이 있습니다. 첫째, 데이터 형식이 비교적 단순하고 대부분이 객관식 질문이므로 평가하기 쉽지만 모델의 답변 선택 범위가 제한되고 모델의 과학적 질문 답변 능력을 완전히 테스트할 수 없습니다. 이에 비해 개방형 Q&A는

몇 년 안에 프로그래머가 쇠퇴할 것이라는 사실을 알고 계십니까? 몇 년 안에 프로그래머가 쇠퇴할 것이라는 사실을 알고 계십니까? Nov 08, 2023 am 11:17 AM

"ComputerWorld" 잡지는 IBM이 엔지니어가 필요한 수학 공식을 작성한 다음 이를 제출하면 프로그래밍이 종료되도록 하는 새로운 언어 FORTRAN을 개발했기 때문에 "프로그래밍은 1960년에 사라질 것"이라는 기사를 쓴 적이 있습니다. 몇 년 후 우리는 비즈니스 용어를 사용하여 문제를 설명하고 컴퓨터에 COBOL이라는 프로그래밍 언어를 사용하면 더 이상 프로그래머가 필요하지 않다는 새로운 말을 들었습니다. 이후 IBM은 직원들이 양식을 작성하고 보고서를 생성할 수 있는 RPG라는 새로운 프로그래밍 언어를 개발해 회사의 프로그래밍 요구 사항 대부분을 이를 통해 완료할 수 있다고 합니다.

사용자 정의 데이터세트에 OpenAI CLIP 구현 사용자 정의 데이터세트에 OpenAI CLIP 구현 Sep 14, 2023 am 11:57 AM

2021년 1월 OpenAI는 DALL-E와 CLIP이라는 두 가지 새로운 모델을 발표했습니다. 두 모델 모두 어떤 방식으로든 텍스트와 이미지를 연결하는 다중 모드 모델입니다. CLIP의 정식 명칭은 Contrastive Language-Image Pre-training(ContrastiveLanguage-ImagePre-training)으로, 대조되는 텍스트-이미지 쌍을 기반으로 하는 사전 학습 방법입니다. CLIP을 소개하는 이유는 무엇인가요? 현재 인기 있는 StableDiffusion은 단일 모델이 아니라 여러 모델로 구성되어 있기 때문입니다. 핵심 구성 요소 중 하나는 사용자의 텍스트 입력을 인코딩하는 데 사용되는 텍스트 인코더이며, 이 텍스트 인코더는 CLIP 모델의 텍스트 인코더 CL입니다.

GR-1 푸리에 지능형 범용 휴머노이드 로봇이 곧 사전 판매를 시작합니다! GR-1 푸리에 지능형 범용 휴머노이드 로봇이 곧 사전 판매를 시작합니다! Sep 27, 2023 pm 08:41 PM

휴머노이드 로봇은 높이 1.65미터, 무게 55킬로그램, 몸의 자유도가 44도입니다. 빠르게 걷고, 장애물을 빠르게 피하고, 경사면을 꾸준히 오르락내리락하고, 충격 간섭에 저항할 수 있습니다. 푸리에 인텔리전스(Fourier Intelligence)의 만능 휴머노이드 로봇 GR-1이 사전 판매를 시작했습니다. 로봇 강당 푸리에 인텔리전스(Fourier Intelligence)의 만능 휴머노이드 로봇 푸리에GR-1(FourierGR-1)이 사전 판매를 시작했습니다. GR-1은 고도의 생체공학적 몸통 구성과 의인화된 모션 제어 기능을 갖추고 있으며, 몸 전체가 44도의 자유도를 갖고 있으며, 걷기, 장애물 회피, 장애물 건너기, 경사면 오르내리기, 간섭 저항 및 다양한 도로 적응 능력을 갖추고 있습니다. 표면. 그것은 일반적인 인공 지능 시스템입니다. 공식 웹사이트 사전 판매 페이지: www.fftai.cn/order#FourierGR-1# 푸리에 인텔리전스를 다시 작성해야 합니다.

보행자 궤적 예측을 위한 효과적인 방법과 일반적인 기본 방법은 무엇입니까? 최고의 컨퍼런스 논문 공유! 보행자 궤적 예측을 위한 효과적인 방법과 일반적인 기본 방법은 무엇입니까? 최고의 컨퍼런스 논문 공유! Oct 17, 2023 am 11:13 AM

궤적 예측은 지난 2년 동안 추진력을 얻었지만 대부분은 차량 궤적 예측의 방향에 중점을 두고 있습니다. 오늘날 자율 주행 심장은 제한된 시나리오에서 인간의 보행자 궤적 예측을 위한 알고리즘인 NeurIPS를 공유합니다. 움직임 패턴은 일반적으로 어느 정도 제한된 규칙을 따릅니다. SHENet은 이러한 가정을 바탕으로 암묵적인 장면 규칙을 학습하여 사람의 미래 궤적을 예측합니다. 이 기사는 자율주행하트의 원본임을 인정받았습니다! 저자의 개인적 이해는 현재 사람의 미래 궤적을 예측하는 것이 인간 움직임의 무작위성과 주관성으로 인해 여전히 어려운 문제라는 것입니다. 그러나 제한된 장면에서 인간의 움직임 패턴은 장면 제약(예: 평면도, 도로 및 장애물)과 인간 대 인간 또는 인간 대 객체 상호 작용으로 인해 달라지는 경우가 많습니다.

See all articles