Tesla의 전 AI 디렉터 Karpathy가 그의 출발과 순수 비전 솔루션을 공개합니다.
Tesla의 전 인공 지능 이사이자 새로운 AI 인터넷 유명 교사인 Andrej Karpathy는 최근 MIT 인공 지능 전문가 Lex Fridman의 팟캐스트에 참여했습니다. 인공지능 마니아들에게 이번 인터뷰는 '이중 셰프 엑스터시'라고 할 수 있다.
약 3시간 30분 동안 진행된 인터뷰에서 두 사람은 인공지능, 우주, 인간 사회 등 거창한 주제를 다루며 자율주행 등 테슬라의 여러 기술에 대해서도 세심하게 이야기를 나눴다. , 옵티머스 휴머노이드 로봇, 특수... SLA 비전 솔루션. 아울러 두 사람은 시청자들이 가장 우려하는 안드레이의 사임과 테슬라가 초음파 레이더를 취소한 이유에 대해서도 이야기를 나눴다.
레이더가 필요하지 않습니다. 비싸지만 사용하기 어렵습니다!
Tesla는 작년에 센서 제품군에서 밀리미터파 레이더를 제거했으며 모든 초음파 레이더를 제거하고 카메라만 유지하며 순수 시각적 솔루션을 채택할 것이라고 발표했습니다. Lex가 물었습니다. "이로 인해 차량의 도로 감지가 더 어려워지거나 쉬워지나요?"
Karpathy는 "사람들은 종종 이러한 센서를 자동차의 필수 자산으로 생각하지만, 전체 제품을 완전히 고려하면 Sex, 이러한 센서는 실제로 잠재적인 부담이 됩니다. "
"이러한 센서는 무료가 아니며 완전한 공급망이 있어야 할 뿐만 아니라 누군가가 책임을 져야 합니다. 구매'라고 말하며 이는 실제 비용이 듭니다.
이와 동시에 센서가 오작동하여 교체가 필요할 수 있습니다. "자동차 제조의 일환으로 센서 생산으로 인해 전반적인 진행이 지연될 수도 있습니다. 따라서 조달 및 유지 관리뿐만 아니라 펌웨어를 작성하는 팀도 필요합니다.
그뿐만 아니라 레이더의 사용도 필요합니다." 센서로 인해 감지 시스템이 실패할 수도 있습니다. Karpathy는 "이를 자동차 시스템에 통합하면 전체 시스템이 과도하게 확장될 것입니다."라고 말했습니다.
너무 많은 센서를 설치하면 데이터 엔진에도 부담이 가해집니다. 시간이 지남에 따라 개발이 계속 진행됨에 따라 센서의 기능은 점점 더 정교해지고 있습니다. "지금은 각각 다른 기능을 가진 레이더가 너무 많습니다. 이로 인해 탐지 시스템이 과도하게 확장되었습니다. 게다가 너무 많은 레이더는 서로 간섭하여 효과에 영향을 미칠 것입니다." "내 생각에 Elon은 단순화를 아주 잘하는 것 같아요. 그는 한때 '가장 좋은 부분은 부품이 아닙니다.'라고 말했습니다. 그는 항상 중요하지 않은 것들을 없애려고 노력하고 항상 뺄셈을 합니다. 왜냐하면 그는 현상을 이해하기 때문입니다. 의 조직 엔트로피 증가 "
비용도 많이 들고, 문제도 많고, 지속적으로 수리해야 합니다. 이는 또한 탐지 시스템의 복잡성을 가져올 것입니다. 이 경우 레이더 설치 비용이 많이 들고 개발 가능성도 별로 없다.
"컴퓨터 비전 엔지니어로서 차량 감지 네트워크를 개선하려면 센서를 추가하는 것이 유용한지, 얼마나 유용한지 고려해야 합니다. 우리는 레이더가 매우 유용한 도로 상태를 제공할 수 있는지 진정으로 판단하기 위해 비교 실험을 수행합니다. 그러나 결과는 그 차이가 크지 않다는 것을 보여주며, 이는 레이더가 유용하지 않다는 것을 의미합니다." Karpathy는 Tesla가 이 기술을 포기한 이유를 설명했을 뿐만 아니라 다른 자동차 회사도 같은 선택을 할 것이라고 주장했습니다. "LiDAR와 마찬가지로 초음파 레이더도 많은 추가 정보를 제공할 수 없다고 생각합니다. 아직 LiDAR를 사용하고 있는 다른 회사에서는 이 기술을 포기할 것이라고 생각합니다."
순수한 시각적 솔루션: 더 좋음
Karpathy for Purely Visual 솔루션은 큰 가능성을 가지고 있습니다. "순수한 비전 솔루션을 선택하면 모든 리소스를 집중하여 강력한 데이터 엔진을 구축할 수 있습니다.""이 센서의 대역폭은 매우 높으며 이 분야에서 상당한 진전을 이루었습니다. 이 기술에 막대한 투자를 하면 놀라운 성과를 달성할 수 있습니다."
Karpathy는 순수한 시각적 솔루션이 필요하고 충분하다고 말했습니다. 어떤 의미에서 세상은 인간의 시각적 소비를 위해 설계되었으며 사람들은 시각적인 욕구를 가지고 있습니다.
동시에 이 솔루션은 모든 운전자에게 필요한 모든 운전 정보를 제공할 수 있습니다. "그래서 우리는 이 기술을 개발하는 데 자원을 집중해야 하며 '정말 다른 센서를 도입하고 싶은가?'라고 자문해야 합니다. 이 경우 대답은 '아니오'라고 생각합니다." 순수 비전 솔루션은 Karpathy로부터 강력한 지지를 받았지만 Lex가 LiDAR와 순수 비전 솔루션, 포인트 클라우드와 복셀의 차이점을 어떻게 보느냐고 물었을 때 Karpathy는 솔직하게 말했습니다. 이 둘은 자율 주행의 초점이 아닙니다. . 그는 다음과 같이 말했습니다: "나는 이 논쟁을 결코 이해하지 못했습니다. 문제의 핵심이 아니기 때문입니다. 자동화를 논의할 때 지원으로 도로 테스트 차량이 있는지 모두가 주목해야 한다고 생각합니다. 이것이 인공적인지 여부입니다. 지능 시스템이 더 좋아질 수 있다." 그러므로 센서의 감지 능력을 고려할 때 포괄적인 접근이 필요합니다. 여기에는 대량의 데이터를 수집하기 위한 도로 테스트 차량을 제공할 수 있는지 여부, 센서와 데이터를 통합할 수 있는지 여부, 센서를 데이터 엔진에 통합하여 데이터의 다양한 부분을 신속하게 검색할 수 있는지 여부, 그리고 사용된 모델을 지속적으로 개선할 수 있는지 여부가 포함됩니다. . 작업 영역에서 자율주행차의 고화질 지도를 제작하는 다른 회사에 대해 어떻게 생각하는지 묻는 질문에 Karpathy는 "정말 말도 안 되는 일입니다!"라고 말했습니다. "우리는 자율주행차가 어떻게 세상을 바꾸다, 글로벌하게 이야기하다 이 기술을 교통 분야에 어떻게 적용할 수 있을까요? 센티미터 수준의 정확한 세계 지도나 도시를 지속적으로 제공하고 이를 자주 업데이트해야 한다면 비용도 너무 많이 듭니다. 높은." Lex가 이 접근 방식이 미국으로 확장될 것인지 물었을 때 Karpathy는 전국의 모든 지역을 볼 때 Tesla의 예를 사용하여 다음과 같이 설명했습니다. "사람들은 그렇게 고정밀 지도가 필요하지 않습니다. -정확한 지도는 전방 도로 상황, 도로 구간 등 주요 정보를 보여주기에 충분합니다. 운전자는 이를 Google 지도를 보는 것처럼 사용할 수 있습니다. 핵심 정보는 주변 환경을 이해하는 것입니다. 그러나 이는 센티미터 수준의 정확도로 지도를 미리 그리지 않으며, 이는 또한 팀의 역량을 약화시키고 기술자가 실제로 필요한 것에 집중하지 못하게 합니다. 컴퓨터 시력 문제. " 나가고 다시 올래? 이것이 사랑입니다 이전에 그는 Tesla에서 5년 동안 근무했으며 Big Boss Musk에게 직접 보고했습니다. Tesla 경영진 중에서는 확실히 베테랑으로 간주됩니다. 보도에 따르면 Li Feifei의 제자는 이전에 몇 달 동안 휴가를 낸 후 가까운 시일 내에 Tesla로 돌아갈 것이라고 말했지만 즉시 사임을 발표했습니다.
Karpathy는 "지난 5년 동안 Tesla가 많은 목표를 달성할 수 있도록 도울 수 있어서 매우 기쁩니다. 떠나기로 결정한 것은 사실 어려운 선택입니다. 이번 5년 동안 자율주행차는 '졸업'을 마쳤습니다. 길을 찾기 위해 고민을 시작으로 도심의 거리를 질주하게 됐다. 앞으로도 더욱 강력해진 자율주행팀의 활약이 기대된다”고 퇴사 후 향후 계획에 대해 밝혔다. 그는 "앞으로 아무것도 없다. 구체적인 계획은 AI 기술 작업, 오픈소스, 교육 등 오랫동안 열정을 갖고 있는 분야로 돌아가는 것일 수도 있다"라고 말했다. 물론 그는 다음과 같은 언급도 했다. 인터뷰에서 Tesla로 복귀 가능성: "어쩌면 언젠가는 돌아와서 Tesla에서 Optimus나 AGI(Artificial General Intelligence) 관련 작업을 할 것입니다. Tesla는 이 대규모 로봇 회사에서 재능 있는 디자이너들과 함께 놀라운 회사가 될 것입니다. 우리는 Tesla 임원에서 인터넷 유명 교사에 이르기까지 Karpathy는 Tesla를 인공 지능으로 떠날 수도 있고, 언젠가 휴머노이드 로봇과 AGI로 복귀할 수도 있습니다. 그가 추구하는 것은 물질이나 지위가 아닌 기술의 지속적인 발전이다. 이는 졸업 후 진로 변경을 거부하고 컴퓨터 이미지 인식 연구에 전념했던 멘토 리페이페이(Li Feifei)의 행동과 유사하다. 아마도 이것은 "선생님처럼, 제자처럼"일 것입니다! 센티미터 수준의 지도: 필요하지 않습니다!
위 내용은 Tesla의 전 AI 디렉터 Karpathy가 그의 출발과 순수 비전 솔루션을 공개합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











지능형 앱 제어는 랜섬웨어나 스파이웨어와 같이 데이터를 손상시킬 수 있는 승인되지 않은 앱으로부터 PC를 보호하는 데 도움이 되는 Windows 11의 매우 유용한 도구입니다. 이 문서에서는 스마트 앱 컨트롤이 무엇인지, 어떻게 작동하는지, Windows 11에서 켜거나 끄는 방법을 설명합니다. Windows 11의 스마트 앱 제어란 무엇입니까? SAC(스마트 앱 제어)는 Windows 1122H2 업데이트에 도입된 새로운 보안 기능입니다. Microsoft Defender 또는 타사 바이러스 백신 소프트웨어와 함께 작동하여 장치 속도를 늦추거나 예상치 못한 광고를 표시하거나 기타 예상치 못한 작업을 수행할 수 있는 잠재적으로 불필요한 앱을 차단합니다. 스마트 애플리케이션

이렇게 강력한 AI 모방 능력을 가지고 있다면, 막는 것은 사실상 불가능합니다. 이제 AI의 발전이 이 정도 수준에 이르렀나? 앞발은 이목구비를 날리게 하고, 뒷발은 쳐다보는 것, 눈썹을 치켜올리는 것, 삐죽이는 것 등 아무리 과장된 표정이라도 완벽하게 흉내낸다. 난이도를 높이고, 눈썹을 더 높이 올리고, 눈을 크게 뜨고, 입 모양까지 비뚤어지게 표현하는 등 가상 캐릭터 아바타가 표정을 완벽하게 재현할 수 있다. 왼쪽의 매개변수를 조정하면 오른쪽의 가상 아바타도 그에 따라 움직임을 변경하여 입과 눈을 클로즈업하여 모방이 완전히 동일하다고는 할 수 없으며 표정만 정확합니다. 마찬가지다(맨 오른쪽). 이 연구는 GaussianAvatars를 제안하는 뮌헨 기술 대학과 같은 기관에서 나왔습니다.

PDF, 웹페이지, 포스터, 엑셀 차트의 내용을 자동으로 분석할 수 있는 대형 모델은 파트타임 근로자에게 그다지 편리하지 않습니다. Shanghai AILab, 홍콩 중문대학교 및 기타 연구 기관에서 제안한 InternLM-XComposer2-4KHD(약칭 IXC2-4KHD) 모델은 이를 현실로 만듭니다. 해상도 제한이 1500x1500 이하인 다른 다중 모드 대형 모델과 비교하여, 이 작업은 다중 모드 대형 모델의 최대 입력 이미지를 4K(3840x1600) 이상의 해상도로 높이고 모든 화면비와 336픽셀을 4K로 지원합니다. 동적 해상도가 변경됩니다. 모델은 출시 3일 만에 허깅페이스 비주얼 질문답변 모델 인기 순위 1위를 차지했다. 취급이 용이함

이 글은 자율주행하트 공개 계정의 허가를 받아 재인쇄되었습니다. 재인쇄를 원하시면 출처에 문의해 주세요. 원제: MotionLM: Multi-Agent Motion Forecasting as Language Modeling 논문 링크: https://arxiv.org/pdf/2309.16534.pdf 저자 소속: Waymo 컨퍼런스: ICCV2023 논문 아이디어: 자율 차량 안전 계획을 위해 미래 행동을 안정적으로 예측 도로요원의 역할이 중요합니다. 본 연구는 연속적인 궤적을 개별 모션 토큰의 시퀀스로 표현하고 다중 에이전트 모션 예측을 언어 모델링 작업으로 처리합니다. 우리가 제안하는 모델인 MotionLM은 다음과 같은 장점을 가지고 있습니다.

"ComputerWorld" 잡지는 IBM이 엔지니어가 필요한 수학 공식을 작성한 다음 이를 제출하면 프로그래밍이 종료되도록 하는 새로운 언어 FORTRAN을 개발했기 때문에 "프로그래밍은 1960년에 사라질 것"이라는 기사를 쓴 적이 있습니다. 몇 년 후 우리는 비즈니스 용어를 사용하여 문제를 설명하고 컴퓨터에 COBOL이라는 프로그래밍 언어를 사용하면 더 이상 프로그래머가 필요하지 않다는 새로운 말을 들었습니다. 이후 IBM은 직원들이 양식을 작성하고 보고서를 생성할 수 있는 RPG라는 새로운 프로그래밍 언어를 개발해 회사의 프로그래밍 요구 사항 대부분을 이를 통해 완료할 수 있다고 합니다.

휴머노이드 로봇은 높이 1.65미터, 무게 55킬로그램, 몸의 자유도가 44도입니다. 빠르게 걷고, 장애물을 빠르게 피하고, 경사면을 꾸준히 오르락내리락하고, 충격 간섭에 저항할 수 있습니다. 푸리에 인텔리전스(Fourier Intelligence)의 만능 휴머노이드 로봇 GR-1이 사전 판매를 시작했습니다. 로봇 강당 푸리에 인텔리전스(Fourier Intelligence)의 만능 휴머노이드 로봇 푸리에GR-1(FourierGR-1)이 사전 판매를 시작했습니다. GR-1은 고도의 생체공학적 몸통 구성과 의인화된 모션 제어 기능을 갖추고 있으며, 몸 전체가 44도의 자유도를 갖고 있으며, 걷기, 장애물 회피, 장애물 건너기, 경사면 오르내리기, 간섭 저항 및 다양한 도로 적응 능력을 갖추고 있습니다. 표면. 그것은 일반적인 인공 지능 시스템입니다. 공식 웹사이트 사전 판매 페이지: www.fftai.cn/order#FourierGR-1# 푸리에 인텔리전스를 다시 작성해야 합니다.

최근 화웨이는 Xuanji 감지 시스템을 탑재한 새로운 스마트 웨어러블 제품을 9월에 출시할 예정이라고 발표했는데, 이는 화웨이의 최신 스마트 워치가 될 것으로 예상됩니다. 이 신제품은 고급 감정 건강 모니터링 기능을 통합하여 사용자에게 정확성, 포괄성, 속도, 유연성, 개방성 및 확장성의 6가지 특성을 갖춘 포괄적인 건강 평가를 제공합니다. 이 시스템은 슈퍼 센싱 모듈을 사용하고 다중 채널 광학 경로 아키텍처 기술을 최적화하여 심박수, 혈중 산소 및 호흡수와 같은 기본 지표의 모니터링 정확도를 크게 향상시킵니다. 또한 Xuanji Sensing System은 심박수 데이터를 기반으로 감정 상태에 대한 연구를 확장했으며, 생리적 지표에 국한되지 않고 사용자의 감정 상태와 스트레스 수준도 평가할 수 있습니다. 60개 이상의 스포츠에 대한 모니터링을 지원합니다. 심혈관, 호흡기, 신경, 내분비,

원제목: TowardsRealisticSceneGenerationwithLiDARDiffusionModels 논문 링크: https://hancyran.github.io/assets/paper/lidar_diffusion.pdf 코드 링크: https://lidar-diffusion.github.io 저자 소속: CMU Toyota Research Institute University of Southern California Paper 아이디어 : 확산 모델(DM)은 사실적인 이미지 합성에 탁월하지만 LiDAR 장면 생성에 적용하는 것은 상당한 과제를 안겨줍니다. 이는 주로 포인트 공간에서 작동하는 DM이 어려움을 겪기 때문입니다.
