딥러닝 알고리즘에서 AI 대형 모델이 등장하면서 현재 AI 분야에서 가장 뜨거운 신기술 패러다임으로 자리잡고 있습니다. 자율주행 기술 역시 대형모델 기술의 도입으로 모듈형 단계에서 엔드투엔드 자율주행으로 진화할 가능성이 있다. AI 대형 모델이 자율주행의 기술적 경로를 재편하고 있습니다.
9월 27일, HaoMo Zhixing과 칭화대학교 지능형 산업 연구소(AIR)가 공동으로 주최한 자율주행에 관한 고품질 공개 강좌가 성공적으로 종료되었습니다. 이 공개 수업은 현재 자율주행을 위한 선도적인 AI 알고리즘과 Haomo의 특정 관행을 결합하여 자율주행 실무자, 업계 파트너 및 미디어 친구들에게 엔드투엔드 자율주행 기술의 향연을 선사합니다.
이 강좌는 자율주행 공개 강좌 시리즈 중 세 번째 강좌입니다. 앞서 1차 및 2차 강좌에서는 거시 산업 및 기술 원리 관점에서 자율주행 지식 시스템에 대한 기본 소개를 제공했습니다. 세 번째 호에서는 Tsinghua AIR의 조연구원 겸 조교수인 Zhan Xianyuan 박사가 의사결정 최적화 관점에서 엔드투엔드 자율주행 AI 알고리즘의 특징과 현재 진행 상황을 설명했고, 기술이사인 Pan Xing 박사는 HaoMo Zhixing의 데이터 폐쇄 루프 시스템에서 AI 대형 모델 알고리즘이 대용량 데이터를 학습하고 최적화하는 방법과 실제로 놀라운 기능을 보여주는 방법에 대해 자세히 설명합니다.
"의사결정 최적화의 관점에서 본 엔드투엔드 자율주행"이라는 제목의 공유에서 Zhan Xianyuan 박사는 엔드투엔드(end-to-end) 개념에서 출발하여 자율주행 산업의 30년 발전 역사와 결합하여, Tsinghua AIR와 Hao Mo의 과학 연구 협력 관행과 결합된 전략적 학습 방법을 모두에게 알리고 AI 알고리즘을 사용하여 산업 발전 맥락에 대한 통찰력을 얻고 요약과 추세를 만듭니다. 산업 발전에 대한 판단.
Dr. Zhan Xianyuan은 간단히 말해서 모든 아키텍처와 다양한 모듈을 완전한 전체로 통합하고 입력에서 출력까지 직접 교육을 수행하며 의사 결정 지점에서 학습 신호를 전달한다고 지적했습니다. 독창적인 모듈화의 장점은 각 모듈이 매우 깔끔하게 분해되고, 각 모듈의 모델링 목표가 매우 명확하며, 해석성이 매우 좋다는 것입니다. 그러나 모듈형 아키텍처에서는 각 모듈마다 설계 및 최적화를 위한 자체 시스템이 있습니다. 여러 모듈을 함께 결합하면 필연적으로 오류가 누적됩니다. 엔드투엔드의 장점은 다음 세 가지에 있습니다. 우선, 전체 end-to-end 모델은 하나의 매우 큰 모델로 간주될 수 있으므로 구조가 매우 간단합니다. 모든 목표는 의사 결정의 최종 목표를 중심으로 최적화 및 학습됩니다. 최적화 수준. 둘째, 입력부터 최종 의사결정 출력까지 End-to-End 학습으로, 대용량 데이터에 의존하는 순수 데이터 기반 학습을 쉽게 구현할 수 있습니다. 셋째, 많은 모델이 동일한 시스템에서 처음부터 끝까지 훈련되기 때문에 다양한 모듈 모델의 백본을 공유할 수 있어 계산 오버헤드가 줄어듭니다.
Zhan Xianyuan 박사는 모든 엔드투엔드 운전 모델이 대규모 의사결정 모델로 간주될 수 있다고 소개했습니다. 이러한 모델을 훈련하려면 의사결정 최적화 알고리즘을 사용해야 합니다. 여기에는 모방 학습과 강화 학습이 포함됩니다. 모방 학습은 지도 학습 방법을 사용하여 데이터에서 직접 학습하는 것이며, 강화 학습은 단순히 데이터를 모방하는 것이 아니라 지속적인 학습을 통해 최적화할 수 있습니다. 사용 가능한 데이터보다 의사결정 모델이 더 중요합니다.
Zhan Xianyuan 박사의 견해로는 초기 엔드투엔드 자율주행 모델은 모두 작은 의사결정 모델이었지만 오늘날 업계에서 구현되는 엔드투엔드 시스템은 모두 거대한 모델입니다. 자율주행은 초기 온라인 모델에서 진화하여 대화형 패러다임이 점차 완전한 오프라인 학습으로 확장되었습니다. 모델이 더욱 강력해지고 향상됨에 따라 보안도 더욱 향상되며 일반화 수준에서는 천천히 일부 개선 및 전환이 이루어집니다. 또한 Zhan Xianyuan 박사는 Tsinghua AIR와 Haimou의 모방 학습 및 오프라인 강화 학습 협력에 대해 자세히 소개했으며 이러한 알고리즘이 Haimou의 자율 주행 시나리오 실습에 점차적으로 적용될 것이라고 말했습니다.
Zhan Xianyuan 박사의 공유 후 Per Xing 박사는 'Hai Mo의 자율 주행 AI로 가는 길'을 주제로 Hao Mo의 구체적인 사례를 통해 산업적 관점에서 AI 알고리즘의 중요성을 설명했습니다. 퍼싱 박사는 자율주행을 전문으로 하는 인공지능 기술 기업으로 하이모의 사용자 보조 주행 주행거리가 8천만km를 넘어섰고, Urban NOH도 일반화 및 반복 작업을 진행 중이며, 차기 양산을 달성할 것으로 예상된다고 말했다. 년도.
퍼싱은 빅모델, 빅데이터, 빅컴퓨팅 파워 추세에 따라 데이터 규모의 증가, 알고리즘 역량의 향상, 활용도가 향상되면서 현 산업은 데이터 중심의 자율주행 3.0 시대로 접어들고 있다고 말했다. 자율주행 제품이 고속 시나리오에서 도심 시나리오로 옮겨가는 만큼 자율주행 데이터 인텔리전스 시스템 구축이 핵심 인프라다. 폐쇄형 데이터 루프를 달성하기 위해 테슬라, 하이모 등 국내 여러 기업도 자체 클라우드 AI 역량과 슈퍼컴퓨팅 센터를 구축해 더 큰 컴퓨팅 파워와 대규모 데이터 처리 역량을 통해 더 나은 결과를 달성하고 있다.
현재 Haomo는 자체 데이터 인텔리전스 시스템 MANA를 구축했으며, 올해 초 중국 자율주행 업계 최대 규모의 지능형 컴퓨팅 센터인 MANA OASIS Snow Lake Oasis를 구축했습니다. 하오모는 MANA OASIS를 기반으로 올해 4월 업계 최초 자율주행 생성 대형 모델 DriveGPT Xuehu·Hairuo를 출시했다. "기본 대형 모델인 Haimo는 DriveGPT를 사용하여 데이터 관리 검색, 자동 주석, AIGC 시뮬레이션 데이터 합성 등을 포함한 추가 AI 기능을 구축합니다. 이러한 데이터 기능과 서비스를 기반으로 자동차의 다양한 모듈과 알고리즘을 더욱 개선합니다. .
퍼싱 박사는 전체 자율주행 반복의 핵심은 데이터 지능이라고 지적했습니다. 이 과정에서 대규모 AI 모델을 통해 이러한 데이터 자산을 더 잘 관리할 수 있습니다. 동시에, 데이터가 확보된 이후에는 컴퓨팅 성능이 필연적으로 필요합니다. 지능형 컴퓨팅 센터의 안정적이고 지속적인 운영은 대형 모델의 반복과 자율 주행 개선을 위한 꾸준한 전력 흐름을 제공합니다.
Dr. Pan Xing은 "데이터와 컴퓨팅 능력을 통해 현재의 자동차-클라우드 연결 및 공동 훈련 방법은 대형 모델을 통해 자동차 측 알고리즘의 효과를 효과적으로 향상시킬 수 있습니다. 예를 들어, 툴 체인은 다음과 같은 작업을 수행할 수 있습니다." 전체 라벨링 비용을 효과적으로 절감하고 라벨링 효율성을 향상시킵니다. 동시에 DriveGPT는 대형 모델을 사용하여 자동차 측 소형 모델의 기능 개선을 직접 지원하고 클라우드의 대형 모델 기능을 자동차 측 모델에 더 잘 전달할 수도 있습니다.
퍼싱 박사는 “보다 현실적인 시뮬레이션 데이터를 효율적으로 얻는 방법은 대형 모델이 매우 중요한 역할을 할 수 있다”고 말했습니다. 대형 모델을 사용하면 질감, 깊이, 의미 및 기타 정보를 매우 효과적으로 배울 수 있습니다. 대형 모델의 효과적인 표현을 통해 데이터를 편집할 수 있습니다. 예를 들어 원본 영상에 없는 차량 장애물을 마음대로 붙여넣고 편집하고 회전할 수 있으며 DriveGPT를 통해 영상에 넣을 수 있어 새로운 시뮬레이션 합성 데이터를 얻을 수 있습니다. . 인지 분야의 적용 외에도 대형 모델은 지능형 운전 의사 결정 및 계획에 큰 역할을 합니다. DriveGPT는 인간 운전의 사용자 데이터를 사용하여 더 나은 운전 행동과 의사 결정을 달성하기 위해 지속적으로 반복하고 학습합니다.
동시에 Haimo DriveGPT는 완전한 궤적 예측과 이미지 합성을 도울 수 있을 뿐만 아니라 지능적인 결정을 내리는 능력도 갖추고 있습니다. "DriveGPT는 미래의 궤적을 예측하고 운전 의사 결정 과정에서 질문에 답하기 위해 비디오를 입력하는 기능을 갖추고 있으며, 이러한 기능을 통해 Weimo는 엔드 투 엔드 자율 주행의 출현으로 매크로를 믿게 되었습니다." 의사결정과 미시행동, 모델을 통해 함께 학습하고 이해하는 것이 더욱 효과적인 수단이 될 것입니다. Pershing 박사는 다음으로 Haimou가 인식과 인지의 두 가지 모델을 더욱 깊게 연결하여 하나로 통합할 것이라고 밝혔습니다.
HaoMo Zhixing과 칭화대학교 지능형산업연구소(AIR)는 4단계로 구성된 자율주행에 관한 고품질 공개 강좌를 편성했습니다. 이전 두 과정에서 Tsinghua AIR와 Hao Mo Zhixing의 강사는 단일 차량 지능형 자율 주행, 차량-도로 협업 자율 주행 및 고급 지능형 도로 건설과 같은 자율 주행 기술 개발을 약 100개 업계 언론에 소개했습니다. 사람들은 모두 자율주행 AI 기술의 기본 원리와 현재 자율주행에 적용되는 대형 모델의 동향에 대해 설명했습니다. 이번 자율주행에 관한 고품질 공개 강좌에서 Haimo와 Tsinghua AIR는 자율주행 업계의 참관인들과 더욱 심도 있는 AI 알고리즘과 자율주행 AI 시스템의 원리를 공유했으며, 온·오프라인 게스트들로부터 적극적인 질문과 교류를 받았습니다.
자율주행 별바다를 바라보며 오직 행동만이 미래의 목표를 진정으로 달성할 수 있습니다. 하이모(Haimo)와 칭화항공(Tsinghua AIR)은 수준 높은 자율주행 공개 강좌를 통해 업계 고위 언론인들과 손을 잡고 자율주행 A 알고리즘에 대한 최신 연구 결과와 실무 경험을 축적해 산과 바다를 넘나들며 공유했다. AI 지식의 지혜를 모아 자율주행 산업에 기여하는 소중한 기술 합의와 지식 축적입니다.
위 내용은 HaoMo Zhixing & Tsinghua AIR 자율주행 오픈클래스 Pan Xing 박사가 HaoMo의 자율주행 AI 실습 현장을 공개했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!