자율주행의 3가지 핵심 요소를 다룬 기사
센서: 다양한 위치 지정 및 기능, 상호 보완적인 장점
자율 차량에는 카메라, 밀리미터파 레이더, LiDAR 등 다양한 센서가 장착되는 경우가 많습니다. 이들 센서는 각각 서로 다른 기능과 위치를 갖고 있으며, 전체적으로 서로의 장점을 보완해 자율주행차의 눈이 됩니다. 2021년 이후 신차에는 OTA를 통해 보다 많은 자율주행 기능을 구현하기 위해 여분의 하드웨어를 확보하기 위해 다수의 센서가 탑재될 예정이다.
2021년 1월~5월 중국 신규 출시 모델의 센서 구성 및 핵심 기능
카메라 기능 : 차선선, 교통표지판, 신호등 등에 주로 사용 차량, 보행자는 물론이고 종합적인 감지 정보와 저렴한 가격이라는 특징을 가지고 있지만 비, 눈, 날씨, 빛의 영향을 받습니다. 현대의 카메라는 렌즈, 렌즈 모듈, 필터, CMOS/CCD, ISP, 데이터 전송 부품으로 구성됩니다. 빛은 광학 렌즈와 필터를 통과한 후 센서에 집중됩니다. 광학 신호는 CMOS 또는 CCD 집적 회로를 통해 전기 신호로 변환된 후 RAW, RGB 또는 YUV 형식의 표준 디지털 이미지로 변환됩니다. 이미지 프로세서(ISP) 신호는 데이터 전송 인터페이스를 통해 컴퓨터로 전송됩니다. 카메라는 풍부한 정보를 제공할 수 있습니다. 그러나 카메라는 자연광원에 의존합니다. 현재 시각 센서의 동적 범위는 특별히 넓지 않습니다. 빛이 부족하거나 빛이 급격히 변하면 시각적 이미지가 일시적으로 손실될 수 있으며 기능이 심각하게 제한됩니다. 비와 오염 상황. 업계에서 컴퓨터 비전은 일반적으로 카메라의 다양한 단점을 극복하는 데 사용됩니다.
자동차 카메라는 고성장 시장입니다. 자율주행 기능이 지속적으로 업그레이드되면서 차량 내 카메라의 활용도가 증가하고 있다. 예를 들어 일반적으로 전방 시야에는 1~3대의 카메라가 필요하고, 서라운드 시야에는 4~8대의 카메라가 필요하다. 2025년까지 세계 자동차 카메라 시장 규모는 1,762억 6천만 위안에 달할 것으로 예상되며, 이 중 중국 시장은 237억 2천만 위안에 이를 것으로 예상됩니다.
2015년부터 2025년까지 전 세계 및 중국의 자동차 카메라 시장 규모(십억 위안)
자동차 카메라 산업 산업 체인에는 업스트림 렌즈 세트 공급업체, 접착 재료 공급업체, 이미지 센서 공급업체가 포함됩니다. , ISP 칩 공급업체는 물론 미드스트림 모듈 공급업체 및 시스템 통합업체, 다운스트림 가전제품 회사, 자율주행 Tier1 등 가치 측면에서는 이미지센서(CMOS 이미지센서)가 전체 비용의 50%를 차지하고, 모듈패키징이 25%, 광학렌즈가 14%를 차지한다.
카메라 산업 체인
라이다(Lidar)의 역할: 주로 주변 물체의 거리와 속도를 감지하는 데 사용됩니다. LiDAR의 송신단에서는 레이저 반도체에 의해 고에너지 레이저 빔이 생성되며, 레이저가 주변 대상과 충돌한 후 반사되어 LiDAR의 수신단에서 거리와 거리를 얻습니다. 목표의 속도. LiDAR는 밀리미터파 및 카메라보다 감지 정확도가 높으며 감지 가능한 감지 거리가 길어 종종 200m 이상에 달합니다. LiDAR는 스캐닝 원리에 따라 기계식, 회전 거울, MEMS 및 고체 LiDAR로 구분됩니다. 거리 측정 원리에 따라 ToF(Time-of-Flight 거리 측정)와 FMCW(주파수 변조 연속파)로 구분할 수 있습니다. 업계는 현재 LiDAR 적용의 탐색 단계에 있으며 아직 명확한 방향이 없으며 향후 어떤 기술 경로가 주류가 될지도 불분명합니다.
레이저 레이더 시장은 광대하며 중국 기업이 미국을 이끌 것입니다. LiDAR 시장은 전망이 넓습니다. 2025년까지 중국 LiDAR 시장은 150억 위안에 가까울 것이며, 2030년에는 세계 시장이 300억 위안에 가까울 것이며, 중국 LiDAR 시장은 350억 위안에 가까울 것으로 예상됩니다. 세계 시장 규모는 650억 위안에 달할 것이며, 시장의 연간 성장률은 48.3%에 달할 것입니다. 미국 최대 자율주행차 회사인 테슬라는 순수 비전 솔루션을 채택하고 있지만, 다른 자동차 회사들은 자동차에 라이더를 탑재할 구체적인 계획이 없기 때문에 중국은 자동차 라이더의 가장 큰 잠재 시장이 되었습니다. 2022년에는 국내 자동차 제조사들이 라이다를 탑재한 제품을 대거 출시할 예정이며, 2022년에는 자동차용 라이다 제품 출하량이 20만대에 이를 것으로 예상된다. 중국 기업은 시장과 더 가깝고, 중국 OEM과의 협력도가 높으며, 시장 주문을 더 쉽게 받을 수 있어 더 빨리 비용을 절감할 수 있어 선순환 구조를 형성할 수 있기 때문에 승소 확률이 더 높다. 중국의 광대한 시장은 중국 LiDAR 회사가 외국 회사와의 기술 격차를 해소하는 데 도움이 될 것입니다.
2022~2030년 중국 Lidar 시장 전망
Lidar 모델 목록
각 현재 단계 각 기술 경로에는 고유한 장점과 단점이 있습니다. 향후 FMCW 기술은 TOF 기술과 공존할 것이며, 1550nm 레이저 이미터는 905nm보다 우수할 것이며, 시장은 반고체 상태를 건너뛰고 바로 전고체 단계로 뛰어들 수도 있을 것으로 판단됩니다.
FMCW 기술은 TOF 기술과 공존합니다. TOF 기술은 상대적으로 성숙하고 빠른 응답 속도와 높은 감지 정확도라는 장점이 있지만 FMCW는 도플러 원리를 통해 속도를 직접 측정할 수 없으며 감도가 높습니다( ToF보다 10배 이상), 강력한 간섭 방지 능력, 장거리 감지 및 낮은 전력 소비. 앞으로 고급 제품은 FMCW를, 저가형 제품은 TOF를 사용할 수도 있다.
1550nm가 905nm보다 낫습니다. 905nm는 인간의 망막에 쉽게 흡수되어 망막 손상을 일으키는 근적외선 레이저이므로 905nm 솔루션은 낮은 전력에서만 유지될 수 있습니다. 1550nm 레이저의 원리는 가시광선 스펙트럼입니다. 동일한 전력 조건에서 레이저는 사람의 눈에 손상을 덜 주고 감지 범위가 더 길지만, 발생기로 InGaAs가 필요하고 실리콘 기반 감지기를 사용할 수 없다는 단점이 있습니다.
반고체 상태를 건너뛰고 완전 고체 상태로 바로 점프: 기존 반고체 솔루션, 회전 거울형, 앵귤러형, MEMS는 모두 기계 부품 수가 적고 서비스 시간이 짧습니다. 차량 환경에서의 생활이 어려워 차량 규제 인증을 통과하기 어렵습니다. 고체 LiDAR용 VCSEL+SPAD 솔루션은 칩 레벨 기술을 채택하고 구조가 간단하며 차량 규정을 쉽게 통과할 수 있으며 현재 순수 고체 LiDAR를 위한 가장 주류 기술 솔루션이 되었습니다. iPhone12 pro 뒤에 있는 LiDAR는 VCSEL + SPAD 솔루션을 사용합니다.
Lidar의 기술 로드맵 및 대표 기업
HD맵이 전복될 수 있습니다. 첨단 지도 분야에서 경로 전쟁은 계속되고 있다. 테슬라는 카메라로 수집한 데이터를 기반으로 인공지능 기술을 사용해 환경의 3차원 공간을 구축하는 등 사전 매핑이 필요 없는 고정밀 지도를 제안했다. . 이는 크라우드소싱 사고를 채택하고 각 차량이 도로 정보를 제공하며 클라우드에서 통합되고 집계됩니다. 그러므로 우리는 기술 혁신으로 인한 고정밀 지도의 전복을 경계할 필요가 있다.
일부 실무자들은 지능적인 운전을 위해서는 고정밀 지도가 필수라고 생각합니다. 시야의 관점에서 볼 때 고정밀 지도는 막히지 않고, 특별한 기상 조건에서도 거리와 시각적 결함이 없는 고정밀 지도입니다. 지도는 여전히 역할을 할 수 있습니다. 효과: 오류 관점에서 보면 고정밀 지도는 일부 센서 오류를 효과적으로 제거하고 일부 도로 조건에서 기존 센서 시스템을 효과적으로 보완하고 수정할 수 있습니다. 또한, 고정밀 지도는 운전 경험 데이터베이스를 구축하고, 다차원 시공간 데이터 마이닝을 통해 위험 지역을 분석하고, 운전자에게 새로운 운전 경험 데이터 세트를 제공할 수도 있습니다.
Lidar + 비전 기술, 수집 차량 + 크라우드소싱 모델은 미래의 고정밀 지도를 위한 주류 솔루션입니다.
HD 지도는 정확성과 속도의 균형을 맞춰야 합니다. 수집 정확도가 너무 낮고 업데이트 빈도가 너무 낮으면 고정밀 지도에 대한 자율 주행 요구 사항을 충족할 수 없습니다. 이 문제를 해결하기 위해 고정밀 지도 회사는 크라우드소싱 모델과 같은 몇 가지 새로운 방법을 채택했습니다. 각 자율주행차는 고정밀 지도 수집 장치 역할을 하여 집계되고 사용을 위해 다른 자동차에 배포됩니다. 이 모델에서는 강자가 항상 강한 상황을 유지하면서 크라우드 소싱에 참여할 수 있는 자동차 모델이 많기 때문에 선도적인 고정밀 지도 회사는 보다 정확하고 빠른 고정밀 지도를 수집할 수 있습니다.
AMAP 융합 솔루션
컴퓨팅 플랫폼: 칩에 대한 요구 사항은 지속적으로 증가하고 있으며, 반도체 기술은 해자입니다
컴퓨팅 플랫폼은 자율 주행 영역이라고도 불립니다. 제어 장치. L3 이상의 자율주행 보급률이 증가함에 따라 컴퓨팅 성능에 대한 요구 사항도 증가합니다. 현재 L3 규정과 알고리즘은 아직 도입되지 않았지만 자동차 회사는 후속 소프트웨어 반복을 위해 컴퓨팅 성능 이중화 솔루션을 채택했습니다.
컴퓨팅 플랫폼은 미래에 이질성과 분산 탄력성이라는 두 가지 개발 특성을 갖게 될 것입니다.
이종성: 고급 자율주행차의 경우 컴퓨팅 플랫폼은 다양한 유형 및 다중 데이터 센서와 호환되어야 하며 높은 보안성과 고성능을 갖춰야 합니다. 기존 단일 칩은 많은 인터페이스 및 컴퓨팅 성능 요구 사항을 충족할 수 없으며 이기종 칩 하드웨어 솔루션이 필요합니다. 이질성은 Audi zFAS 통합 MCU(마이크로컨트롤러), FPGA(프로그래밍 가능 게이트 어레이), CPU(중앙 처리 장치) 등과 같은 여러 아키텍처 칩을 통합하는 단일 보드에 반영될 수도 있으며 강력한 단일 칩에도 반영될 수 있습니다. (SoC, 시스템 온 칩)은 NVIDIA Xavier 통합 GPU(그래픽 프로세서) 및 CPU 2개의 이기종 장치와 같은 여러 아키텍처 장치를 동시에 통합합니다.
배포 유연성: 현재 자동차 전자 아키텍처는 도메인 컨트롤러에 점진적으로 통합되는 많은 단일 기능 칩으로 구성됩니다. 고급 자율 주행에는 시스템 이중화 및 원활한 확장과 같은 기능을 갖춘 온보드 지능형 컴퓨팅 플랫폼이 필요합니다. 한편으로는 이기종 아키텍처와 시스템 중복성을 고려하여 다중 보드를 사용하여 시스템 분리 및 백업을 달성하는 반면, 다중 보드 분산 확장은 고급 컴퓨팅 성능 및 인터페이스 요구 사항을 충족하는 데 사용됩니다. 자율주행. 동일한 자율 주행 운영 체제의 통합 관리 및 적용에 따라 전체 시스템은 자율 주행 기능을 공동으로 구현하고 하드웨어 드라이버, 통신 서비스 등을 변경하여 다양한 칩을 적용합니다. 자율주행 수준이 높아짐에 따라 시스템의 컴퓨팅 파워, 인터페이스 등에 대한 수요도 날로 증가할 것입니다. 단일 칩의 컴퓨팅 성능을 높이는 것 외에도 하드웨어 구성 요소를 반복적으로 쌓아 하드웨어 구성 요소의 유연한 조정과 원활한 확장을 달성함으로써 전체 시스템의 컴퓨팅 성능을 향상하고 인터페이스를 늘리며 기능을 향상시킬 수 있습니다.
이기종 분산 하드웨어 아키텍처는 주로 AI 장치, 컴퓨팅 장치 및 제어 장치의 세 부분으로 구성됩니다.
AI 유닛: 병렬 컴퓨팅 아키텍처 AI 칩을 채택하고 멀티 코어 CPU를 사용하여 AI 칩과 필요한 프로세서를 구성합니다. 현재 AI 칩은 다중 센서 데이터의 효율적인 융합 및 처리, 실행 레이어 실행을 위한 핵심 정보 출력에 주로 사용됩니다. AI 유닛은 이기종 아키텍처에서 가장 까다로운 부분으로, 산업화 요구 사항을 충족하려면 비용, 전력 소비, 성능의 병목 현상을 극복해야 합니다. AI 칩은 GPU, FPGA, ASIC(응용프로그램별 집적회로) 등을 선택할 수 있습니다.
다른 유형의 칩 비교
컴퓨팅 장치: 컴퓨팅 장치는 여러 개의 CPU로 구성됩니다. 높은 단일 코어 주파수와 강력한 컴퓨팅 성능을 갖추고 있으며 해당 기능 안전 요구 사항을 충족합니다. Linux의 커널 관리 시스템인 Loading Hypervisor는 소프트웨어 자원을 관리하고 작업 스케줄링을 완료하며 자율주행과 관련된 대부분의 핵심 알고리즘을 실행하고 다차원 데이터를 통합하여 경로 계획 및 의사결정 제어를 달성하는 데 사용됩니다.
제어 장치: 주로 기존 차량 컨트롤러(MCU)를 기반으로 합니다. 제어 장치는 ClassicAUTOSAR 플랫폼의 기본 소프트웨어를 로드하고 MCU는 통신 인터페이스를 통해 ECU에 연결되어 차량 동역학의 수평 및 종방향 제어를 달성하고 기능 안전 ASIL-D 수준 요구 사항을 충족합니다.
Tesla FSD 칩을 예로 들어 보겠습니다. FSD 칩은 CPU+GPU+ASIC 아키텍처를 사용합니다. 2.2GHz에서 실행되는 총 12개의 CPU에 대한 3개의 쿼드 코어 Cortex-A72 클러스터, 1GHz에서 실행되는 Mali G71 MP12 GPU, 2개의 NPU(신경 처리 장치) 및 기타 다양한 하드웨어 가속기가 포함되어 있습니다. 세 가지 유형의 센서 사이에는 명확한 업무 구분이 있습니다. Cortex-A72 코어 CPU는 일반 컴퓨팅 처리에 사용되고 Mali 코어 GPU는 경량 후처리에 사용되며 NPU는 신경망 계산에 사용됩니다. GPU 컴퓨팅 성능은 600GFLOPS에 도달하고 NPU 컴퓨팅 성능은 73.73Tops에 도달합니다.
Tesla FSD 칩 아키텍처
자율주행 도메인 컨트롤러의 핵심 기술은 칩이고, 그 다음이 소프트웨어와 운영체제입니다. 능력.
칩은 자율주행 컴퓨팅 플랫폼의 컴퓨팅 성능을 결정합니다. 설계 및 제조가 어렵고 쉽게 링크가 걸릴 수 있습니다. 하이엔드 시장은 엔비디아, 모빌아이, 텍사스 인스트루먼트, NXP 등 세계적인 반도체 거대 기업들이 장악하고 있다. L2 이하 시장에서는 호라이즌으로 대표되는 국내 기업들이 점차 고객들로부터 인지도를 얻고 있다. 중국의 도메인 컨트롤러 제조업체는 일반적으로 칩 제조업체와 긴밀하게 협력하여 칩을 구매하고 자체 하드웨어 제조 및 소프트웨어 통합 기능을 통해 OEM에 제공합니다. 칩 회사와의 협력은 일반적으로 배타적입니다. 칩 협력의 관점에서 Desay SV는 Nvidia 및 Thunderstar와 Qualcomm의 제휴를 통해 가장 확실한 이점을 가지고 있습니다. 또 다른 국내 자율주행 도메인 컨트롤러 기업인 화양그룹(Huayang Group)은 화웨이 하이실리콘(Huawei HiSilicon), 뉴소프트 리치(Neusoft Reach)와 제휴해 NXP, 호라이즌과 협력관계를 구축했다.
국내 도메인 컨트롤러 업체와 칩 업체의 협력 관계
도메인 컨트롤러의 경쟁력은 상위 협력 칩 업체에 의해 결정되며, 하위 OEM이 칩을 구매하는 경우가 많습니다. 기업에서 제공하는 솔루션 세트입니다. 예를 들어 Weilai, Ideal 및 Xpeng의 고급 모델은 NVIDIA Orin 칩과 NVIDIA 자율 주행 소프트웨어를 구매하고 Jikrpton 및 BMW는 칩 회사인 Changan에서 솔루션을 구매하고 Great Wall은 Horizon의 L2 솔루션을 구매합니다. 우리는 칩과 도메인 컨트롤러 회사 간의 협력에 계속 관심을 기울여야 합니다.
칩회사 제품과 자동차회사의 협력
3. 데이터와 알고리즘 : 데이터는 알고리즘을 반복하는데 도움을 주며, 알고리즘 품질은 자율주행 기업의 핵심 경쟁력입니다
사용자 데이터는 자율주행 시스템을 변화시키는 데 매우 중요합니다. 자율주행 과정에서 일어날 가능성이 거의 없는 드문 시나리오가 있는데, 이런 시나리오를 코너 케이스(Corner Case)라고 한다. 감지 시스템이 코너 케이스에 직면하면 심각한 보안 위험이 발생할 수 있습니다. 예를 들어, 지난 몇 년 동안 발생한 일은 Tesla의 Autopilot이 건너던 대형 흰색 트럭을 인식하지 못하고 측면에서 충돌하여 2022년 4월에 소유자가 사망한 것입니다. Xiaopeng은 시동을 켜는 동안 추락하고 전복되었습니다. 자율주행. 도로 한가운데를 달리는 차량.
이러한 문제에 대한 해결책은 자동차 회사가 앞장서서 실제 데이터를 수집하는 동시에 자율주행 컴퓨팅 플랫폼에서 보다 유사한 환경을 시뮬레이션하여 시스템이 다음에 더 잘 처리하는 법을 배우십시오. 전형적인 예는 Tesla의 섀도우 모드입니다. 인간 운전자의 행동과 비교하여 잠재적인 코너 케이스를 식별합니다. 그런 다음 이러한 장면에 주석을 달고 훈련 세트에 추가합니다.
이에 따라 자동차 회사에서는 수집된 실제 데이터를 모델 반복에 활용하고, 반복된 모델을 실제 생산 차량에 탑재할 수 있도록 데이터 처리 프로세스를 구축해야 합니다. 동시에 기계가 코너케이스를 대규모로 학습할 수 있도록 코너케이스를 얻은 후 이 코너케이스에서 직면한 문제에 대해 대규모 시뮬레이션을 수행하고 시스템 학습을 위해 더 많은 코너케이스를 파생합니다. NVIDIA가 Metaverse 기술을 사용하여 개발한 시뮬레이션 플랫폼인 Nvidia DriveSim은 시뮬레이션 시스템 중 하나입니다. 데이터를 선도하는 기업은 데이터 해자를 구축합니다.
일반적인 데이터 처리 절차는 다음과 같습니다.
1) 자율주행차가 코너 케이스에 직면했는지 판단하고 업로드
2) 업로드된 데이터에 주석을 달기
3) 시뮬레이션 소프트웨어를 사용하여 추가 교육 데이터를 시뮬레이션하고 생성
4) 반복적으로 업데이트 데이터가 포함된 신경망 모델
5) OTA를 통해 모델을 실제 차량에 배포
데이터 처리 프로세스
데이터 폐쇄 루프 뒤에는 엄청난 컴퓨팅 성능이 필요합니다. 2022CES에서의 NVIDIA 연설에 따르면 L2 보조 운전 시스템에 투자하는 회사는 1~2,000개의 GPU만 필요한 반면, 완전한 L4 자율 주행 시스템을 개발하는 회사는 데이터 센터를 구축하는 데 25,000개의 GPU가 필요합니다.
1. Tesla는 현재 총 11,544개의 GPU를 갖춘 3개의 주요 컴퓨팅 센터를 보유하고 있습니다. 자동 마킹 컴퓨팅 센터에는 1,752개의 A100 GPU가 있으며, 훈련에 사용되는 다른 2개의 컴퓨팅 센터에는 2021년에 각각 4,032개 및 5,760개의 A100 GPU가 있습니다. AI DAY가 자체 개발한 DOJO 슈퍼컴퓨터 시스템은 3,000개의 D1 칩과 최대 1.1EFLOPS의 컴퓨팅 성능을 갖추고 있습니다.
2. SenseTime이 건설 중인 상하이 슈퍼컴퓨팅 센터 프로젝트는 20,000+A100 GPU를 계획하고 있으며, 완료되면 최대 컴퓨팅 성능은 3.65EFLPOS(BF16/CFP8)에 도달할 것입니다.
위 내용은 자율주행의 3가지 핵심 요소를 다룬 기사의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











어제 인터뷰 도중 롱테일 관련 질문을 해본 적이 있느냐는 질문을 받아서 간략하게 요약해볼까 생각했습니다. 자율주행의 롱테일 문제는 자율주행차의 엣지 케이스, 즉 발생 확률이 낮은 가능한 시나리오를 말한다. 인지된 롱테일 문제는 현재 단일 차량 지능형 자율주행차의 운영 설계 영역을 제한하는 주요 이유 중 하나입니다. 자율주행의 기본 아키텍처와 대부분의 기술적인 문제는 해결되었으며, 나머지 5%의 롱테일 문제는 점차 자율주행 발전을 제한하는 핵심이 되었습니다. 이러한 문제에는 다양한 단편적인 시나리오, 극단적인 상황, 예측할 수 없는 인간 행동이 포함됩니다. 자율 주행에서 엣지 시나리오의 "롱테일"은 자율주행차(AV)의 엣지 케이스를 의미하며 발생 확률이 낮은 가능한 시나리오입니다. 이런 희귀한 사건

0. 전면 작성&& 자율주행 시스템은 다양한 센서(예: 카메라, 라이더, 레이더 등)를 사용하여 주변 환경을 인식하고 알고리즘과 모델을 사용하는 고급 인식, 의사결정 및 제어 기술에 의존한다는 개인적인 이해 실시간 분석과 의사결정을 위해 이를 통해 차량은 도로 표지판을 인식하고, 다른 차량을 감지 및 추적하며, 보행자 행동을 예측하는 등 복잡한 교통 환경에 안전하게 작동하고 적응할 수 있게 되므로 현재 널리 주목받고 있으며 미래 교통의 중요한 발전 분야로 간주됩니다. . 하나. 하지만 자율주행을 어렵게 만드는 것은 자동차가 주변에서 일어나는 일을 어떻게 이해할 수 있는지 알아내는 것입니다. 이를 위해서는 자율주행 시스템의 3차원 객체 감지 알고리즘이 주변 환경의 객체의 위치를 포함하여 정확하게 인지하고 묘사할 수 있어야 하며,

StableDiffusion3의 논문이 드디어 나왔습니다! 이 모델은 2주 전에 출시되었으며 Sora와 동일한 DiT(DiffusionTransformer) 아키텍처를 사용합니다. 출시되자마자 큰 화제를 불러일으켰습니다. 이전 버전과 비교하여 StableDiffusion3에서 생성된 이미지의 품질이 크게 향상되었습니다. 이제 다중 테마 프롬프트를 지원하고 텍스트 쓰기 효과도 향상되었으며 더 이상 잘못된 문자가 표시되지 않습니다. StabilityAI는 StableDiffusion3이 800M에서 8B 범위의 매개변수 크기를 가진 일련의 모델임을 지적했습니다. 이 매개변수 범위는 모델이 많은 휴대용 장치에서 직접 실행될 수 있어 AI 사용이 크게 줄어든다는 것을 의미합니다.

자율주행 궤적 예측은 차량의 주행 과정에서 발생하는 다양한 데이터를 분석하여 차량의 향후 주행 궤적을 예측하는 것을 의미합니다. 자율주행의 핵심 모듈인 궤도 예측의 품질은 후속 계획 제어에 매우 중요합니다. 궤적 예측 작업은 풍부한 기술 스택을 보유하고 있으며 자율 주행 동적/정적 인식, 고정밀 지도, 차선, 신경망 아키텍처(CNN&GNN&Transformer) 기술 등에 대한 익숙함이 필요합니다. 시작하기가 매우 어렵습니다! 많은 팬들은 가능한 한 빨리 궤도 예측을 시작하여 함정을 피하기를 희망합니다. 오늘은 궤도 예측을 위한 몇 가지 일반적인 문제와 입문 학습 방법을 살펴보겠습니다. 관련 지식 입문 1. 미리보기 논문이 순서대로 되어 있나요? A: 먼저 설문조사를 보세요, p

원제목: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving 논문 링크: https://arxiv.org/pdf/2402.02519.pdf 코드 링크: https://github.com/HKUST-Aerial-Robotics/SIMPL 저자 단위: Hong Kong University of Science 및 기술 DJI 논문 아이디어: 이 논문은 자율주행차를 위한 간단하고 효율적인 모션 예측 기준선(SIMPL)을 제안합니다. 기존 에이전트 센트와 비교

전면 및 시작점 작성 엔드 투 엔드 패러다임은 통합 프레임워크를 사용하여 자율 주행 시스템에서 멀티 태스킹을 달성합니다. 이 패러다임의 단순성과 명확성에도 불구하고 하위 작업에 대한 엔드투엔드 자율 주행 방법의 성능은 여전히 단일 작업 방법보다 훨씬 뒤떨어져 있습니다. 동시에 이전 엔드투엔드 방법에서 널리 사용된 조밀한 조감도(BEV) 기능으로 인해 더 많은 양식이나 작업으로 확장하기가 어렵습니다. 여기서는 희소 검색 중심의 엔드 투 엔드 자율 주행 패러다임(SparseAD)이 제안됩니다. 여기서 희소 검색은 밀집된 BEV 표현 없이 공간, 시간 및 작업을 포함한 전체 운전 시나리오를 완전히 나타냅니다. 특히 통합 스파스 아키텍처는 탐지, 추적, 온라인 매핑을 포함한 작업 인식을 위해 설계되었습니다. 게다가 무겁다.

지난 달에는 몇 가지 잘 알려진 이유로 업계의 다양한 교사 및 급우들과 매우 집중적인 교류를 가졌습니다. 교환에서 피할 수 없는 주제는 자연스럽게 엔드투엔드와 인기 있는 Tesla FSDV12입니다. 저는 이 기회를 빌어 여러분의 참고와 토론을 위해 지금 이 순간 제 생각과 의견을 정리하고 싶습니다. End-to-End 자율주행 시스템을 어떻게 정의하고, End-to-End 해결을 위해 어떤 문제가 예상되나요? 가장 전통적인 정의에 따르면, 엔드 투 엔드 시스템은 센서로부터 원시 정보를 입력하고 작업과 관련된 변수를 직접 출력하는 시스템을 의미합니다. 예를 들어 이미지 인식에서 CNN은 기존의 특징 추출 + 분류기 방식에 비해 end-to-end 방식으로 호출할 수 있습니다. 자율주행 작업에서는 다양한 센서(카메라/LiDAR)로부터 데이터를 입력받아

표적 탐지는 자율주행 시스템에서 상대적으로 성숙한 문제이며, 그 중 보행자 탐지는 가장 먼저 배포되는 알고리즘 중 하나입니다. 대부분의 논문에서 매우 포괄적인 연구가 수행되었습니다. 그러나 서라운드 뷰를 위한 어안 카메라를 사용한 거리 인식은 상대적으로 덜 연구되었습니다. 큰 방사형 왜곡으로 인해 표준 경계 상자 표현은 어안 카메라에서 구현하기 어렵습니다. 위의 설명을 완화하기 위해 확장된 경계 상자, 타원 및 일반 다각형 디자인을 극/각 표현으로 탐색하고 인스턴스 분할 mIOU 메트릭을 정의하여 이러한 표현을 분석합니다. 제안된 다각형 형태의 모델 fisheyeDetNet은 다른 모델보다 성능이 뛰어나며 동시에 자율 주행을 위한 Valeo fisheye 카메라 데이터 세트에서 49.5% mAP를 달성합니다.
