목차
YOLOv10에는 어떤 개선 사항이 있나요?
실험적 비교
기술 주변기기 일체 포함 YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

Jun 09, 2024 pm 05:29 PM
엔드투엔드 표적 탐지

지난 몇 년 동안 YOLO는 계산 비용과 감지 성능 간의 효과적인 균형으로 인해 실시간 객체 감지 분야의 주류 패러다임이 되었습니다. 연구자들은 YOLO의 구조 설계, 최적화 목표, 데이터 개선 전략 등에 대해 심층적인 탐구를 수행하여 상당한 진전을 이루었습니다. 그러나 NMS(Non-Maximum Suppression)에 대한 사후 처리 의존도는 YOLO의 엔드투엔드 배포를 방해하고 추론 대기 시간에 부정적인 영향을 미칩니다. 더욱이 YOLO의 다양한 구성 요소 설계에는 포괄적이고 철저한 검토가 부족하여 상당한 계산 중복이 발생하고 모델 성능이 제한됩니다. 이로 인해 효율성이 최적화되지 않고 성능이 향상될 가능성이 커집니다. 이 작업에서 우리는 후처리와 모델 아키텍처 모두에서 YOLO의 성능 효율성 경계를 더욱 발전시키는 것을 목표로 합니다. 이를 위해 우리는 먼저 경쟁력 있는 성능과 낮은 추론 지연 시간을 동시에 제공하는 NMS 없는 YOLO 교육을 위한 지속적인 이중 할당을 제안합니다. 또한 YOLO를 위한 포괄적인 효율성-정확성 중심 모델 설계 전략을 소개합니다. 효율성과 정확성의 관점에서 YOLO의 각 구성 요소를 포괄적으로 최적화하여 계산 오버헤드를 크게 줄이고 모델 기능을 향상시켰습니다. 우리 노력의 결과로 YOLOv10이라는 실시간 엔드투엔드 객체 감지를 위해 설계된 차세대 YOLO 시리즈가 탄생했습니다. 광범위한 실험에 따르면 YOLOv10은 다양한 모델 규모에서 최첨단 성능과 효율성을 달성합니다. 예를 들어 COCO 데이터세트에서 YOLOv10-S는 유사한 AP의 RT-DETR-R18보다 1.8배 빠르며 매개변수 및 부동 소수점 연산(FLOP)을 2.8배 줄였습니다. YOLOv9-C와 비교하여 YOLOv10-B는 동일한 성능에서 대기 시간을 46% 줄이고 매개 변수를 25% 줄입니다. 코드 링크: https://github.com/THU-MIG/yolov10.

YOLOv10에는 어떤 개선 사항이 있나요?

먼저 NMS가 없는 YOLO에 대한 지속적인 이중 할당 전략을 제안하여 후처리의 중복 예측 문제를 해결합니다. 이 전략에는 이중 레이블 할당 및 일관된 일치 측정항목이 포함됩니다. 이를 통해 모델은 훈련 중에 풍부하고 조화로운 감독을 얻는 동시에 추론 중에 NMS의 필요성을 제거하고 높은 효율성을 유지하면서 경쟁력 있는 성능을 달성할 수 있습니다.

이번에는 모델 아키텍처에 대한 포괄적인 효율성-정확도 기반 모델 설계 전략을 제안하고 YOLO의 각 구성 요소를 종합적으로 검토합니다. 효율성 측면에서 명백한 계산 중복을 줄이고 보다 효율적인 아키텍처를 달성하기 위해 경량 분류 헤드, 공간 채널 분리 다운샘플링 및 순위 안내 블록 설계가 제안됩니다.

정확도 측면에서 대규모 커널 컨볼루션을 탐색하고 효과적인 부분 self-attention 모듈을 제안하여 모델 기능을 향상하고 저렴한 비용으로 성능 개선 잠재력을 활용합니다.

이러한 방법을 기반으로 저자는 다양한 모델 크기, 즉 YOLOv10-N/S/M/B/L/X를 사용하여 일련의 실시간 엔드투엔드 감지기를 성공적으로 구현했습니다. 표준 개체 감지 벤치마크에 대한 광범위한 실험에서 YOLOv10은 다양한 모델 크기의 계산 정확도 절충 측면에서 이전 최첨단 모델을 능가하는 능력을 보여줍니다. 그림 1에 표시된 것처럼 유사한 성능에서 YOLOv10-S/X는 RT-DETR R18/R101보다 각각 1.8배/1.3배 빠릅니다. YOLOv9-C와 비교하여 YOLOv10-B는 동일한 성능에서 46%의 대기 시간 감소를 달성합니다. 또한 YOLOv10은 매우 높은 매개변수 활용 효율성을 보여줍니다. YOLOv10-L/X는 YOLOv8-L/X보다 0.3AP와 0.5AP 높으며 매개변수 수가 각각 1.8배, 2.3배 감소했습니다. YOLOv10-M은 YOLOv9-M/YOLO-MS와 유사한 AP를 달성하면서 매개변수 수를 각각 23% 및 31% 줄였습니다.

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

교육 과정에서 YOLO는 일반적으로 TAL(Task Assignment Learning)을 활용하여 각 인스턴스에 여러 샘플을 할당합니다. 일대다 할당 방법을 채택하면 풍부한 감독 신호가 생성되어 더 강력한 성능을 최적화하고 달성하는 데 도움이 됩니다. 그러나 이로 인해 YOLO는 NMS(비최대 억제) 사후 처리에 의존해야 하므로 배포 시 추론 효율성이 최적이 아닙니다. 이전 연구에서는 중복 예측을 억제하기 위해 일대일 매칭 접근 방식을 탐색했지만, 추론 오버헤드를 추가하거나 최적이 아닌 성능을 초래하는 경우가 많습니다. 본 연구에서는 이중 라벨 할당과 일관된 매칭 측정항목을 채택하여 높은 효율성과 경쟁력 있는 성능을 달성하는 NMS 없는 교육 전략을 제안합니다. 이 전략을 통해 YOLO는 더 이상 교육에 NMS가 필요하지 않으며 높은 효율성과 경쟁력 있는 성과를 달성합니다.

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

효율성 중심 모델 디자인. YOLO의 구성 요소에는 스템, 다운샘플링 레이어, 기본 빌딩 블록이 포함된 스테이지 및 헤드가 포함됩니다. 백본 부분의 계산 비용이 매우 낮기 때문에 나머지 세 부분에 대해서는 효율성 중심의 모델 설계를 수행합니다.

(1) 경량 분류 헤더. YOLO에서는 분류 헤드와 회귀 헤드가 일반적으로 동일한 아키텍처를 갖습니다. 그러나 계산 오버헤드에는 상당한 차이가 있습니다. 예를 들어 YOLOv8-S에서는 분류 헤드(FLOP 및 매개변수의 5.95G/1.51M)와 회귀 헤드(2.34G/0.64M)의 FLOP 개수와 매개변수가 회귀의 2.5배와 2.4배입니다. 각각 머리. 그러나 분류 오류와 회귀 오류(표 6 참조)의 영향을 분석함으로써 YOLO 성능에 회귀 헤드가 더 중요하다는 사실을 발견했습니다. 따라서 성능 저하에 대한 걱정 없이 분류 헤더의 오버헤드를 줄일 수 있습니다. 따라서 우리는 커널 크기가 3×3인 두 개의 깊이 분리 가능한 컨볼루션과 1×1 커널로 구성된 경량 분류 헤드 아키텍처를 간단히 채택했습니다. 위의 개선을 통해 우리는 컨볼루션 커널 크기가 3×3인 두 개의 깊이 분리 가능한 컨볼루션과 1×1 컨볼루션 커널로 구성된 경량 분류 헤드의 아키텍처를 단순화할 수 있습니다. 이 단순화된 아키텍처는 더 적은 계산 오버헤드와 매개변수 수로 분류 기능을 달성할 수 있습니다.

(2) 공간 채널 분리 다운샘플링. YOLO는 일반적으로 스트라이드가 2인 일반 3×3 표준 컨볼루션을 사용하는 동시에 공간 다운샘플링(H × W에서 H/2 × W/2로)과 채널 변환(C에서 2C로)을 구현합니다. 이로 인해 무시할 수 없는 계산 비용과 매개변수 수가 발생합니다. 대신, 보다 효율적인 다운샘플링을 달성하기 위해 공간 감소와 채널 증가 작업을 분리할 것을 제안합니다. 구체적으로, 포인트별 컨볼루션은 먼저 채널 크기를 변조하는 데 활용되고, 그런 다음 깊이별 컨볼루션이 공간 다운샘플링에 활용됩니다. 이렇게 하면 계산 비용이 로 줄어들고 매개변수 수가 로 줄어듭니다. 동시에 다운샘플링 중에 정보 보존을 극대화하여 경쟁력 있는 성능을 유지하면서 대기 시간을 줄입니다.

(3) 순위 안내에 따른 모듈 설계. YOLO는 일반적으로 YOLOv8의 병목 현상 블록과 같이 모든 단계에 대해 동일한 기본 빌딩 블록을 사용합니다. 이러한 YOLO의 동형 설계를 철저히 조사하기 위해 고유 순위를 활용하여 각 단계의 중복성을 분석합니다. 구체적으로 각 단계의 마지막 기본블록에 있는 마지막 콘볼루션의 수치순위를 계산하는데, 이는 임계값보다 큰 특이값의 개수를 센다. 그림 3(a)는 YOLOv8의 결과를 보여주며, 딥 스테이지와 대규모 모델이 더 많은 중복성을 나타낼 가능성이 더 높다는 것을 보여줍니다. 이 관찰은 단순히 동일한 블록 설계를 모든 단계에 적용하는 것이 최고의 용량 효율성 균형을 달성하는 데 차선책임을 시사합니다. 이 문제를 해결하기 위해 컴팩트한 아키텍처 설계를 통해 중복되는 것으로 판명된 단계의 복잡성을 줄이는 것을 목표로 하는 순위 기반 모듈 설계 방식이 제안되었습니다.

그림 3(b)와 같이 먼저 공간 믹싱을 위해 저렴한 깊이별 컨볼루션을 채택하고 채널 믹싱을 위해 비용 효율적인 포인트별 컨볼루션을 채택한 컴팩트한 역 블록(CIB) 구조를 소개합니다. 예를 들어 ELAN 구조에 내장된 효과적인 기본 빌딩 블록 역할을 할 수 있습니다(그림 3(b)). 그런 다음 경쟁력을 유지하면서 최적의 효율성을 달성하기 위해 순위 기반 모듈 할당 전략이 옹호됩니다. 구체적으로, 모델이 주어지면 모든 단계를 고유 순위의 오름차순에 따라 정렬합니다. 선행단의 기본 블록을 CIB로 교체한 후의 성능 변화를 추가로 검토합니다. 해당 모델에 비해 성능 저하가 없으면 계속해서 다음 단계를 교체하고, 그렇지 않으면 프로세스를 중단합니다. 결과적으로 우리는 다양한 단계와 모델 크기에서 적응형 컴팩트 블록 설계를 구현하여 성능 저하 없이 더 큰 효율성을 달성할 수 있습니다.

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

정밀도 중심의 모델 디자인을 기반으로 합니다. 이 백서는 최소 비용으로 성능을 향상시키는 것을 목표로 정밀 기반 설계를 달성하기 위해 대형 커널 컨볼루션 및 self-attention 메커니즘을 추가로 탐구합니다.

(1) 대규모 커널 컨볼루션. 대형 커널 딥 컨볼루션을 채택하는 것은 수용 필드를 확장하고 모델의 기능을 향상시키는 효과적인 방법입니다. 그러나 단순히 모든 단계에서 이를 활용하면 작은 물체를 감지하는 데 사용되는 얕은 기능에 오염이 발생할 수 있으며 고해상도 단계에서 상당한 I/O 오버헤드와 대기 시간이 발생할 수도 있습니다. 따라서 저자들은 딥 스테이지의 CIB(Inter-Stage Information Block)에서 대규모 커널 딥 콘볼루션을 활용할 것을 제안합니다. 여기서 CIB의 두 번째 3×3 깊이 컨볼루션의 커널 크기는 7×7로 증가됩니다. 또한 추론 오버헤드를 증가시키지 않고 최적화 문제를 완화하기 위해 또 다른 3×3 깊이 컨볼루션 분기를 도입하기 위해 구조적 재매개변수화 기술이 채택되었습니다. 또한 모델 크기가 증가함에 따라 수용 필드가 자연스럽게 확장되고 큰 커널 컨볼루션을 사용하는 이점이 점차 감소합니다. 따라서 큰 커널 컨볼루션은 작은 모델 규모에서만 사용됩니다.

(2) 부분적 자기 주의(PSA). Self-Attention 메커니즘은 뛰어난 전역 모델링 기능으로 인해 다양한 시각적 작업에 널리 사용됩니다. 그러나 계산 복잡도와 메모리 사용량이 높습니다. 이 문제를 해결하기 위해 유비쿼터스 주의 헤드 중복성을 고려하여 저자는 그림 3.(c)와 같이 효율적인 부분 자기 주의(PSA) 모듈 설계를 제안합니다. 구체적으로, 특징은 1×1 컨볼루션 이후 채널별로 두 부분으로 균등하게 나뉩니다. MHSA(Multi-Head Self-Attention Module)와 FFN(Feed-Forward Network)으로 구성된 NPSA 블록에는 기능 중 일부만 입력됩니다. 그런 다음 특징의 두 부분을 1×1 컨볼루션을 통해 접합하고 융합합니다. 또한 MHSA의 쿼리 및 키 크기를 값의 절반으로 설정하고 빠른 추론을 위해 LayerNorm을 BatchNorm으로 바꿉니다. PSA는 self-attention의 2차 계산 복잡성으로 인해 발생하는 과도한 오버헤드를 피하기 위해 가장 낮은 해상도로 4단계 이후에만 배치됩니다. 이러한 방식으로 전역 표현 학습 기능을 낮은 계산 비용으로 YOLO에 통합할 수 있으므로 모델의 기능이 향상되고 성능이 향상됩니다.

실험적 비교

여기서는 너무 많은 소개는 하지 않고 결과만 말씀드리겠습니다! ! ! 지연 시간은 줄어들고 성능은 계속해서 향상됩니다.

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지

위 내용은 YOLOv10이 왔습니다! 진정한 실시간 엔드투엔드 표적 탐지의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

<gum> : Bubble Gum Simulator Infinity- 로얄 키를 얻고 사용하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Nordhold : Fusion System, 설명
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora : 마녀 트리의 속삭임 - Grappling Hook 잠금 해제 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

end-to-end은 무슨 뜻인가요? end-to-end은 무슨 뜻인가요? Sep 27, 2021 pm 12:10 PM

엔드투엔드는 "네트워크 연결"을 의미합니다. 네트워크가 통신하려면 연결이 설정되어야 합니다. 얼마나 멀리 떨어져 있거나 얼마나 많은 기계가 있는지에 관계없이 두 끝 사이에 연결이 설정되어야 합니다. 연결이 설정되면 이를 종단이라고 합니다. -end 연결, 즉 end-to-end가 논리적 링크입니다.

정확한 객체 감지를 위한 다중 그리드 중복 경계 상자 주석 정확한 객체 감지를 위한 다중 그리드 중복 경계 상자 주석 Jun 01, 2024 pm 09:46 PM

1. 서론 현재 주요 객체 검출기는 Deep CNN의 용도 변경된 백본 분류기 네트워크를 기반으로 하는 2단계 또는 단일 단계 네트워크입니다. YOLOv3은 입력 이미지를 수신하고 이를 동일한 크기의 그리드 매트릭스로 나누는 잘 알려진 최첨단 단일 스테이지 검출기 중 하나입니다. 표적 중심이 있는 그리드 셀은 특정 표적을 탐지하는 역할을 담당합니다. 오늘 제가 공유하는 것은 정확한 딱 맞는 경계 상자 예측을 달성하기 위해 각 대상에 여러 그리드를 할당하는 새로운 수학적 방법입니다. 연구원들은 또한 표적 탐지를 위한 효과적인 오프라인 복사-붙여넣기 데이터 향상 기능을 제안했습니다. 새로 제안된 방법은 현재의 일부 최첨단 객체 감지기보다 훨씬 뛰어난 성능을 발휘하며 더 나은 성능을 약속합니다. 2. 배경 타겟 탐지 네트워크는 다음을 사용하도록 설계되었습니다.

엔드투엔드(End-to-End)와 차세대 자율주행 시스템, 그리고 엔드투엔드 자율주행에 대한 몇 가지 오해에 대해 이야기해볼까요? 엔드투엔드(End-to-End)와 차세대 자율주행 시스템, 그리고 엔드투엔드 자율주행에 대한 몇 가지 오해에 대해 이야기해볼까요? Apr 15, 2024 pm 04:13 PM

지난 달에는 몇 가지 잘 알려진 이유로 업계의 다양한 교사 및 급우들과 매우 집중적인 교류를 가졌습니다. 교환에서 피할 수 없는 주제는 자연스럽게 엔드투엔드와 인기 있는 Tesla FSDV12입니다. 저는 이 기회를 빌어 여러분의 참고와 토론을 위해 지금 이 순간 제 생각과 의견을 정리하고 싶습니다. End-to-End 자율주행 시스템을 어떻게 정의하고, End-to-End 해결을 위해 어떤 문제가 예상되나요? 가장 전통적인 정의에 따르면, 엔드 투 엔드 시스템은 센서로부터 원시 정보를 입력하고 작업과 관련된 변수를 직접 출력하는 시스템을 의미합니다. 예를 들어 이미지 인식에서 CNN은 기존의 특징 추출 + 분류기 방식에 비해 end-to-end 방식으로 호출할 수 있습니다. 자율주행 작업에서는 다양한 센서(카메라/LiDAR)로부터 데이터를 입력받아

표적 탐지를 위한 새로운 SOTA: YOLOv9가 출시되고 새로운 아키텍처가 기존 컨볼루션을 다시 구현합니다. 표적 탐지를 위한 새로운 SOTA: YOLOv9가 출시되고 새로운 아키텍처가 기존 컨볼루션을 다시 구현합니다. Feb 23, 2024 pm 12:49 PM

표적 탐지 분야에서 YOLOv9는 새로운 아키텍처와 방법을 채택함으로써 기존 컨볼루션의 매개변수 활용을 효과적으로 향상시켜 이전 세대 제품보다 성능이 훨씬 뛰어납니다. YOLOv8이 2023년 1월에 공식 출시된 지 1년 이상이 지난 후, 마침내 YOLOv9이 출시되었습니다! Joseph Redmon, Ali Farhadi 등이 2015년에 1세대 YOLO 모델을 제안한 이후 표적 탐지 분야의 연구자들은 이를 여러 번 업데이트하고 반복했습니다. YOLO는 이미지의 전역 정보를 기반으로 한 예측 시스템으로, 모델 성능이 지속적으로 향상됩니다. 알고리즘과 기술을 지속적으로 개선함으로써 연구원들은 놀라운 결과를 얻었으며 YOLO는 표적 탐지 작업에서 점점 더 강력해졌습니다.

nuScenes의 최신 SOTA | SparseAD: Sparse 쿼리는 효율적인 엔드투엔드 자율주행을 지원합니다! nuScenes의 최신 SOTA | SparseAD: Sparse 쿼리는 효율적인 엔드투엔드 자율주행을 지원합니다! Apr 17, 2024 pm 06:22 PM

전면 및 시작점 작성 엔드 투 엔드 패러다임은 통합 프레임워크를 사용하여 자율 주행 시스템에서 멀티 태스킹을 달성합니다. 이 패러다임의 단순성과 명확성에도 불구하고 하위 작업에 대한 엔드투엔드 자율 주행 방법의 성능은 여전히 ​​단일 작업 방법보다 훨씬 뒤떨어져 있습니다. 동시에 이전 엔드투엔드 방법에서 널리 사용된 조밀한 조감도(BEV) 기능으로 인해 더 많은 양식이나 작업으로 확장하기가 어렵습니다. 여기서는 희소 검색 중심의 엔드 투 엔드 자율 주행 패러다임(SparseAD)이 제안됩니다. 여기서 희소 검색은 밀집된 BEV 표현 없이 공간, 시간 및 작업을 포함한 전체 운전 시나리오를 완전히 나타냅니다. 특히 통합 스파스 아키텍처는 탐지, 추적, 온라인 매핑을 포함한 작업 인식을 위해 설계되었습니다. 게다가 무겁다.

고성능 이미지 추적 및 표적 탐지를 위해 C++를 사용하는 방법은 무엇입니까? 고성능 이미지 추적 및 표적 탐지를 위해 C++를 사용하는 방법은 무엇입니까? Aug 26, 2023 pm 03:25 PM

고성능 이미지 추적 및 표적 탐지를 위해 C++를 사용하는 방법은 무엇입니까? 개요: 인공지능과 컴퓨터 비전 기술의 급속한 발전으로 영상추적 및 표적탐지가 중요한 연구분야가 되었다. 이 기사에서는 C++ 언어와 일부 오픈 소스 라이브러리를 사용하여 고성능 이미지 추적 및 대상 탐지를 달성하는 방법을 소개하고 코드 예제를 제공합니다. 소개: 이미지 추적과 객체 감지는 컴퓨터 비전 분야에서 두 가지 중요한 작업입니다. 영상감시, 자율주행, 지능형 교통시스템 등 다양한 분야에서 널리 사용되고 있습니다. ~을 위한

여러 SOTA! OV-Uni3DETR: 카테고리, 장면 및 양식 전반에 걸쳐 3D 감지의 일반화 가능성 향상(Tsinghua & HKU) 여러 SOTA! OV-Uni3DETR: 카테고리, 장면 및 양식 전반에 걸쳐 3D 감지의 일반화 가능성 향상(Tsinghua & HKU) Apr 11, 2024 pm 07:46 PM

본 논문에서는 3D 객체 감지 분야, 특히 Open-Vocabulary를 위한 3D 객체 감지 분야에 대해 논의합니다. 기존 3D 객체 감지 작업에서 시스템은 일반적으로 포인트 클라우드 또는 RGB 이미지에 의존하는 실제 장면 3D 경계 상자 및 의미 범주 레이블에서 객체의 위치를 ​​예측해야 합니다. 2D 객체 감지 기술은 편재성과 속도로 인해 우수한 성능을 발휘하지만, 관련 연구에 따르면 3D 범용 감지 기술의 개발은 이에 비해 뒤떨어져 있는 것으로 나타났습니다. 현재 대부분의 3D 객체 감지 방법은 여전히 ​​완전 지도 학습에 의존하고 있으며 특정 입력 모드에서 완전히 주석이 달린 데이터로 제한되며 실내 또는 실외 장면에서 훈련 중에 나타나는 카테고리만 인식할 수 있습니다. 이 논문에서는 3D 범용 표적 탐지가 직면한 과제가 주로 다음과 같다고 지적합니다.

2024년에는 중국의 엔드투엔드 자율주행에 실질적인 돌파구와 진전이 있을까요? 2024년에는 중국의 엔드투엔드 자율주행에 실질적인 돌파구와 진전이 있을까요? May 08, 2024 pm 02:49 PM

Tesla V12가 북미에서 대규모로 출시되어 우수한 성능으로 인해 점점 더 많은 사용자로부터 인정을 받고 있다는 사실을 모두가 이해할 수는 없습니다. 자율주행 산업에 대해. 최근 여러 업계의 일류 엔지니어, 제품 관리자, 투자자, 언론인과 교류할 기회가 있었는데, 모두가 엔드투엔드 자율주행에 관심이 많지만 일부 측면에서는 그렇습니다. 엔드투엔드 자율주행에 대한 기본적인 이해, 아직도 이런 오해가 존재합니다. 국내 1위 브랜드와 FSD V11, V12 두 가지 버전의 사진 유무에 관계없이 시티 기능을 경험해 본 행운아로서, 이 단계에서 몇 가지를 기본으로 말씀드리고자 합니다. 나의 직업적 배경과 지난 수년간 Tesla FSD의 진행 상황을 추적합니다.

See all articles