HaoMo Zhixing & Tsinghua AIR 자율주행 오픈클래스 Pan Xing 박사가 HaoMo의 자율주행 AI 실습 현장을 공개했습니다.
딥러닝 알고리즘에서 AI 대형 모델이 등장하면서 현재 AI 분야에서 가장 뜨거운 신기술 패러다임으로 자리잡고 있습니다. 자율주행 기술 역시 대형모델 기술의 도입으로 모듈형 단계에서 엔드투엔드 자율주행으로 진화할 가능성이 있다. AI 대형 모델이 자율주행의 기술적 경로를 재편하고 있습니다.
9월 27일, HaoMo Zhixing과 칭화대학교 지능형 산업 연구소(AIR)가 공동으로 주최한 자율주행에 관한 고품질 공개 강좌가 성공적으로 종료되었습니다. 이 공개 수업은 현재 자율주행을 위한 선도적인 AI 알고리즘과 Haomo의 특정 관행을 결합하여 자율주행 실무자, 업계 파트너 및 미디어 친구들에게 엔드투엔드 자율주행 기술의 향연을 선사합니다.
이 강좌는 자율주행 공개 강좌 시리즈 중 세 번째 강좌입니다. 앞서 1차 및 2차 강좌에서는 거시 산업 및 기술 원리 관점에서 자율주행 지식 시스템에 대한 기본 소개를 제공했습니다. 세 번째 호에서는 Tsinghua AIR의 조연구원 겸 조교수인 Zhan Xianyuan 박사가 의사결정 최적화 관점에서 엔드투엔드 자율주행 AI 알고리즘의 특징과 현재 진행 상황을 설명했고, 기술이사인 Pan Xing 박사는 HaoMo Zhixing의 데이터 폐쇄 루프 시스템에서 AI 대형 모델 알고리즘이 대용량 데이터를 학습하고 최적화하는 방법과 실제로 놀라운 기능을 보여주는 방법에 대해 자세히 설명합니다.
"의사결정 최적화의 관점에서 본 엔드투엔드 자율주행"이라는 제목의 공유에서 Zhan Xianyuan 박사는 엔드투엔드(end-to-end) 개념에서 출발하여 자율주행 산업의 30년 발전 역사와 결합하여, Tsinghua AIR와 Hao Mo의 과학 연구 협력 관행과 결합된 전략적 학습 방법을 모두에게 알리고 AI 알고리즘을 사용하여 산업 발전 맥락에 대한 통찰력을 얻고 요약과 추세를 만듭니다. 산업 발전에 대한 판단.
Dr. Zhan Xianyuan은 간단히 말해서 모든 아키텍처와 다양한 모듈을 완전한 전체로 통합하고 입력에서 출력까지 직접 교육을 수행하며 의사 결정 지점에서 학습 신호를 전달한다고 지적했습니다. 독창적인 모듈화의 장점은 각 모듈이 매우 깔끔하게 분해되고, 각 모듈의 모델링 목표가 매우 명확하며, 해석성이 매우 좋다는 것입니다. 그러나 모듈형 아키텍처에서는 각 모듈마다 설계 및 최적화를 위한 자체 시스템이 있습니다. 여러 모듈을 함께 결합하면 필연적으로 오류가 누적됩니다. 엔드투엔드의 장점은 다음 세 가지에 있습니다. 우선, 전체 end-to-end 모델은 하나의 매우 큰 모델로 간주될 수 있으므로 구조가 매우 간단합니다. 모든 목표는 의사 결정의 최종 목표를 중심으로 최적화 및 학습됩니다. 최적화 수준. 둘째, 입력부터 최종 의사결정 출력까지 End-to-End 학습으로, 대용량 데이터에 의존하는 순수 데이터 기반 학습을 쉽게 구현할 수 있습니다. 셋째, 많은 모델이 동일한 시스템에서 처음부터 끝까지 훈련되기 때문에 다양한 모듈 모델의 백본을 공유할 수 있어 계산 오버헤드가 줄어듭니다.
Zhan Xianyuan 박사는 모든 엔드투엔드 운전 모델이 대규모 의사결정 모델로 간주될 수 있다고 소개했습니다. 이러한 모델을 훈련하려면 의사결정 최적화 알고리즘을 사용해야 합니다. 여기에는 모방 학습과 강화 학습이 포함됩니다. 모방 학습은 지도 학습 방법을 사용하여 데이터에서 직접 학습하는 것이며, 강화 학습은 단순히 데이터를 모방하는 것이 아니라 지속적인 학습을 통해 최적화할 수 있습니다. 사용 가능한 데이터보다 의사결정 모델이 더 중요합니다.
Zhan Xianyuan 박사의 견해로는 초기 엔드투엔드 자율주행 모델은 모두 작은 의사결정 모델이었지만 오늘날 업계에서 구현되는 엔드투엔드 시스템은 모두 거대한 모델입니다. 자율주행은 초기 온라인 모델에서 진화하여 대화형 패러다임이 점차 완전한 오프라인 학습으로 확장되었습니다. 모델이 더욱 강력해지고 향상됨에 따라 보안도 더욱 향상되며 일반화 수준에서는 천천히 일부 개선 및 전환이 이루어집니다. 또한 Zhan Xianyuan 박사는 Tsinghua AIR와 Haimou의 모방 학습 및 오프라인 강화 학습 협력에 대해 자세히 소개했으며 이러한 알고리즘이 Haimou의 자율 주행 시나리오 실습에 점차적으로 적용될 것이라고 말했습니다.
Zhan Xianyuan 박사의 공유 후 Per Xing 박사는 'Hai Mo의 자율 주행 AI로 가는 길'을 주제로 Hao Mo의 구체적인 사례를 통해 산업적 관점에서 AI 알고리즘의 중요성을 설명했습니다. 퍼싱 박사는 자율주행을 전문으로 하는 인공지능 기술 기업으로 하이모의 사용자 보조 주행 주행거리가 8천만km를 넘어섰고, Urban NOH도 일반화 및 반복 작업을 진행 중이며, 차기 양산을 달성할 것으로 예상된다고 말했다. 년도.
퍼싱은 빅모델, 빅데이터, 빅컴퓨팅 파워 추세에 따라 데이터 규모의 증가, 알고리즘 역량의 향상, 활용도가 향상되면서 현 산업은 데이터 중심의 자율주행 3.0 시대로 접어들고 있다고 말했다. 자율주행 제품이 고속 시나리오에서 도심 시나리오로 옮겨가는 만큼 자율주행 데이터 인텔리전스 시스템 구축이 핵심 인프라다. 폐쇄형 데이터 루프를 달성하기 위해 테슬라, 하이모 등 국내 여러 기업도 자체 클라우드 AI 역량과 슈퍼컴퓨팅 센터를 구축해 더 큰 컴퓨팅 파워와 대규모 데이터 처리 역량을 통해 더 나은 결과를 달성하고 있다.
현재 Haomo는 자체 데이터 인텔리전스 시스템 MANA를 구축했으며, 올해 초 중국 자율주행 업계 최대 규모의 지능형 컴퓨팅 센터인 MANA OASIS Snow Lake Oasis를 구축했습니다. 하오모는 MANA OASIS를 기반으로 올해 4월 업계 최초 자율주행 생성 대형 모델 DriveGPT Xuehu·Hairuo를 출시했다. "기본 대형 모델인 Haimo는 DriveGPT를 사용하여 데이터 관리 검색, 자동 주석, AIGC 시뮬레이션 데이터 합성 등을 포함한 추가 AI 기능을 구축합니다. 이러한 데이터 기능과 서비스를 기반으로 자동차의 다양한 모듈과 알고리즘을 더욱 개선합니다. .
퍼싱 박사는 전체 자율주행 반복의 핵심은 데이터 지능이라고 지적했습니다. 이 과정에서 대규모 AI 모델을 통해 이러한 데이터 자산을 더 잘 관리할 수 있습니다. 동시에, 데이터가 확보된 이후에는 컴퓨팅 성능이 필연적으로 필요합니다. 지능형 컴퓨팅 센터의 안정적이고 지속적인 운영은 대형 모델의 반복과 자율 주행 개선을 위한 꾸준한 전력 흐름을 제공합니다.
퍼싱 박사는 “보다 현실적인 시뮬레이션 데이터를 효율적으로 얻는 방법은 대형 모델이 매우 중요한 역할을 할 수 있다”고 말했습니다. 대형 모델을 사용하면 질감, 깊이, 의미 및 기타 정보를 매우 효과적으로 배울 수 있습니다. 대형 모델의 효과적인 표현을 통해 데이터를 편집할 수 있습니다. 예를 들어 원본 영상에 없는 차량 장애물을 마음대로 붙여넣고 편집하고 회전할 수 있으며 DriveGPT를 통해 영상에 넣을 수 있어 새로운 시뮬레이션 합성 데이터를 얻을 수 있습니다. . 인지 분야의 적용 외에도 대형 모델은 지능형 운전 의사 결정 및 계획에 큰 역할을 합니다. DriveGPT는 인간 운전의 사용자 데이터를 사용하여 더 나은 운전 행동과 의사 결정을 달성하기 위해 지속적으로 반복하고 학습합니다.
동시에 Haimo DriveGPT는 완전한 궤적 예측과 이미지 합성을 도울 수 있을 뿐만 아니라 지능적인 결정을 내리는 능력도 갖추고 있습니다. "DriveGPT는 미래의 궤적을 예측하고 운전 의사 결정 과정에서 질문에 답하기 위해 비디오를 입력하는 기능을 갖추고 있으며, 이러한 기능을 통해 Weimo는 엔드 투 엔드 자율 주행의 출현으로 매크로를 믿게 되었습니다." 의사결정과 미시행동, 모델을 통해 함께 학습하고 이해하는 것이 더욱 효과적인 수단이 될 것입니다. Pershing 박사는 다음으로 Haimou가 인식과 인지의 두 가지 모델을 더욱 깊게 연결하여 하나로 통합할 것이라고 밝혔습니다.
자율주행 별바다를 바라보며 오직 행동만이 미래의 목표를 진정으로 달성할 수 있습니다. 하이모(Haimo)와 칭화항공(Tsinghua AIR)은 수준 높은 자율주행 공개 강좌를 통해 업계 고위 언론인들과 손을 잡고 자율주행 A 알고리즘에 대한 최신 연구 결과와 실무 경험을 축적해 산과 바다를 넘나들며 공유했다. AI 지식의 지혜를 모아 자율주행 산업에 기여하는 소중한 기술 합의와 지식 축적입니다.
위 내용은 HaoMo Zhixing & Tsinghua AIR 자율주행 오픈클래스 Pan Xing 박사가 HaoMo의 자율주행 AI 실습 현장을 공개했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

ChatGpt 4는 현재 이용 가능하고 널리 사용되며 ChatGpt 3.5와 같은 전임자와 비교하여 상황을 이해하고 일관된 응답을 생성하는 데 상당한 개선을 보여줍니다. 향후 개발에는보다 개인화 된 인터가 포함될 수 있습니다

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

OpenAi의 O1 : 12 일 선물 Spree는 아직 가장 강력한 모델로 시작합니다. 12 월의 도착은 세계의 일부 지역에서 전 세계적으로 속도가 저하 된 눈송이를 가져 오지만 Openai는 막 시작되었습니다. Sam Altman과 그의 팀은 12 일 선물을 시작하고 있습니다.

Google Deepmind 's Gencast : 일기 예보를위한 혁신적인 AI 일기 예보는 기초 관측에서 정교한 AI 구동 예측으로 이동하여 극적인 변화를 겪었습니다. Google Deepmind의 Gencast, 획기적인

이 기사에서는 AI 모델이 Lamda, Llama 및 Grok과 같은 Chatgpt를 능가하는 것에 대해 논의하여 정확성, 이해 및 산업 영향의 장점을 강조합니다. (159 자).
