경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서-일체 포함-php.cn

1. 배경

2. : 경량, 글로벌, 적응형

3. AFFNet: 경량 시각적 네트워크의 새로운 백본

4 실험 결과

5. 결론

집

기술 주변기기

일체 포함

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 17, 2023 pm 05:57 PM

연구 믿다

1. 배경

수년에 걸쳐 세 가지 시각적 백본 네트워크인 Transformer, 대형 커널 CNN 및 MLP는 주로 효율적인 글로벌 규모로 인해 광범위한 컴퓨터 비전 작업에서 큰 성공을 거두었습니다. 정보 융합

Transformer, CNN 및 MLP는 현재 세 가지 주류 신경망이며, 글로벌 토큰 융합을 달성하기 위해 각각 서로 다른 방법을 사용합니다. Transformer 네트워크에서 self-attention 메커니즘은 쿼리 키 쌍의 상관 관계를 토큰 융합의 가중치로 사용합니다. CNN은 컨볼루션 커널의 크기를 확장하여 Transformer와 유사한 성능을 달성합니다. MLP는 완전한 연결을 통해 모든 토큰 간의 또 다른 강력한 패러다임을 구현합니다. 이러한 방법은 효과적이지만 계산 복잡도(O(N^2))가 높고 저장 및 컴퓨팅 기능이 제한된 장치에 배포하기 어렵기 때문에 많은 모델의 적용 범위가 제한됩니다

2. : 경량, 글로벌, 적응형

계산 비용이 많이 드는 문제를 해결하기 위해 연구원들은 적응형 푸리에 필터(AFF) 알고리즘이라는 효율적인 글로벌 토큰 융합을 개발했습니다. 이 알고리즘은 푸리에 변환을 사용하여 토큰 집합을 주파수 영역으로 변환하고, 주파수 영역에서 적응형 콘텐츠가 가능한 필터 마스크를 학습하여 주파수 영역 공간으로 변환된 토큰 집합에 대해 적응형 필터링 작업을 수행합니다

적응형 주파수 필터 : Efficient Global Token Mixers

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

원문에 액세스하려면 이 링크를 클릭하십시오: https://arxiv.org/abs/2307.14008

주파수 영역 컨볼루션 정리에 따르면 AFF 토큰 믹서의 수학 등가 연산은 원본 영역에서 수행되는 컨볼루션 연산으로, 푸리에 영역에서 수행되는 Hadamard 곱 연산과 동일합니다. 이는 AFF 토큰 믹서가 원본 도메인에서 동적 컨볼루션 커널을 사용하여 콘텐츠 적응형 글로벌 토큰 융합을 달성할 수 있음을 의미합니다. 해당 커널의 공간 해상도는 토큰 세트의 크기와 동일합니다(아래 그림의 오른쪽 하위 그림 참조).

동적 컨볼루션은 계산 비용이 많이 든다는 것은 잘 알려져 있습니다. 특히 공간 해상도가 큰 동적 컨볼루션 커널을 사용할 경우 이 비용은 효율적이고 가벼운 네트워크 설계에 허용되지 않는 것 같습니다. 그러나 이 글에서 제안하는 AFF 토큰 믹서는 낮은 전력 소비로 동등한 구현에서 위의 요구 사항을 동시에 충족할 수 있어 복잡성을 O(N^2)에서 O(N log N)로 줄여 계산 효율성을 크게 향상시킬 수 있습니다

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

개략도 1: AFF 모듈 및 AFFNet 네트워크의 구조를 보여줍니다.

3. AFFNet: 경량 시각적 네트워크의 새로운 백본

AFF 토큰 믹서를 주요 신경망 운영 연산자로 사용 연구진은 AFFNet이라는 경량 신경망 구축에 성공했습니다. 풍부한 실험 결과는 AFF Token Mixer가 시각적 의미 인식 및 조밀한 예측 작업을 포함한 광범위한 시각적 작업에서 정확성과 효율성의 탁월한 균형을 달성한다는 것을 보여줍니다.

4 실험 결과

연구원들은 AFF의 성능을 평가했습니다 시각적 의미 인식, 분할, 탐지 등 다양한 작업에 대한 Token Mixer 및 AFFNet을 현재 연구 분야에서 가장 진보된 경량 시각적 백본 네트워크와 비교합니다. 실험 결과는 모델 디자인이 다양한 시각적 작업에서 잘 수행됨을 보여줌으로써 차세대 경량 및 효율적인 토큰 융합 연산자로서 AFF Token Mixer의 잠재력을 확인시켜 줍니다

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

SOTA와 비교하여 그림 2는 Acc를 보여줍니다. -ImageNet-1K 데이터세트의 Param 및 Acc-FLOPs 곡선

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

최첨단 방법의 결과를 ImageNet-1K 데이터세트와 비교, 표 1

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

을 참조하세요. 표 2는 최첨단 기술을 사용한 시각적 감지 및 분할 작업 비교를 보여줍니다

5. 결론

이 연구는 잠재 공간의 주파수 영역 변환이 글로벌 적응형 토큰 융합에서 중요한 역할을 하며 효율적이고 저전력 등가 구현임을 증명합니다. 신경망에서 토큰 융합 연산자 설계를 위한 새로운 연구 아이디어를 제공하고, 특히 저장 및 컴퓨팅 기능이 제한적인 경우 에지 장치에 신경망 모델을 배포하기 위한 새로운 개발 공간을 제공합니다

위 내용은 경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7563

Cakephp 튜토리얼

1385

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

CUDA의 보편적인 행렬 곱셈: 입문부터 숙련까지! Mar 25, 2024 pm 12:30 PM

GEMM(일반 행렬 곱셈)은 많은 응용 프로그램과 알고리즘의 중요한 부분이며 컴퓨터 하드웨어 성능을 평가하는 중요한 지표 중 하나이기도 합니다. GEMM 구현에 대한 심층적인 연구와 최적화는 고성능 컴퓨팅과 소프트웨어와 하드웨어 시스템 간의 관계를 더 잘 이해하는 데 도움이 될 수 있습니다. 컴퓨터 과학에서 GEMM의 효과적인 최적화는 컴퓨팅 속도를 높이고 리소스를 절약할 수 있으며, 이는 컴퓨터 시스템의 전반적인 성능을 향상시키는 데 중요합니다. GEMM의 작동 원리와 최적화 방법에 대한 심층적인 이해는 현대 컴퓨팅 하드웨어의 잠재력을 더 잘 활용하고 다양하고 복잡한 컴퓨팅 작업에 대한 보다 효율적인 솔루션을 제공하는 데 도움이 될 것입니다. GEMM의 성능을 최적화하여

워드 문서에서 덧셈, 뺄셈, 곱셈, 나눗셈을 계산하는 방법 Mar 19, 2024 pm 08:13 PM

WORD는 워드를 사용하여 다양한 텍스트를 편집할 수 있는 강력한 워드 프로세서입니다. Excel 표에서는 덧셈, 뺄셈, 승수 계산 방법을 익혔습니다. 따라서 Word 표에서 숫자의 덧셈을 계산해야 한다면, 승수를 빼는 방법은 계산기로만 계산할 수 있나요? 대답은 물론 '아니요'입니다. WORD도 그렇게 할 수 있습니다. 오늘은 Word 문서에서 수식을 사용하여 표의 덧셈, 뺄셈, 곱셈, 나눗셈 등의 기본 연산을 계산하는 방법을 함께 배워보겠습니다. 그럼 오늘은 WORD 문서에서 덧셈, 뺄셈, 곱셈, 나눗셈을 계산하는 방법을 자세히 보여드리겠습니다. 1단계: WORD를 열고 툴바의 [삽입] 아래 [표]를 클릭한 후 드롭다운 메뉴에 표를 삽입합니다.

모델, 데이터 및 프레임워크에 대한 심층 분석: 효율적인 대규모 언어 모델에 대한 철저한 54페이지 검토 Jan 14, 2024 pm 07:48 PM

대규모 언어 모델(LLM)은 자연어 이해, 언어 생성, 복잡한 추론을 비롯한 여러 중요한 작업에서 강력한 기능을 입증했으며 사회에 지대한 영향을 미쳤습니다. 그러나 이러한 뛰어난 기능을 사용하려면 상당한 교육 리소스(왼쪽 참조)와 긴 추론 시간(오른쪽 참조)이 필요합니다. 따라서 연구자들은 효율성 문제를 해결하기 위한 효과적인 기술적 수단을 개발해야 합니다. 또한 그림의 오른쪽에서 볼 수 있듯이 Mistral-7B와 같은 일부 효율적인 LLM(LanguageModel)이 LLM의 설계 및 배포에 성공적으로 사용되었습니다. 이러한 효율적인 LLM은 LLaMA1-33B와 유사한 정확도를 유지하면서 추론 메모리를 크게 줄일 수 있습니다.

Python의 count() 함수를 사용하여 목록의 요소 수를 계산하는 방법 Nov 18, 2023 pm 02:53 PM

Python의 count() 함수를 사용하여 목록의 요소 수를 계산하려면 특정 코드 예제가 필요합니다. 강력하고 배우기 쉬운 프로그래밍 언어인 Python은 다양한 데이터 구조를 처리하기 위한 많은 내장 함수를 제공합니다. 그 중 하나는 목록의 요소 수를 계산하는 데 사용할 수 있는 count() 함수입니다. 이번 글에서는 count() 함수의 사용법을 자세히 설명하고 구체적인 코드 예시를 제공하겠습니다. count() 함수는 Python의 내장 함수로, 특정 값을 계산하는 데 사용됩니다.

행렬식을 사용하여 삼각형의 면적을 계산하는 Java 프로그램 Aug 31, 2023 am 10:17 AM

소개 행렬식을 이용하여 삼각형의 면적을 계산하는 자바 프로그램은 세 꼭지점의 좌표를 주어 삼각형의 면적을 계산할 수 있는 간결하고 효율적인 프로그램이다. 이 프로그램은 Java에서 기본 산술 및 대수 계산을 사용하는 방법과 Scanner 클래스를 사용하여 사용자 입력을 읽는 방법을 보여주기 때문에 기하학을 배우거나 작업하는 모든 사람에게 유용합니다. 프로그램은 사용자에게 삼각형의 세 점 좌표를 묻는 메시지를 표시하고 이를 읽어 좌표 행렬의 행렬식을 계산하는 데 사용합니다. 행렬식의 절대값을 사용하여 면적이 항상 양수인지 확인한 다음 공식을 사용하여 삼각형의 면적을 계산하여 사용자에게 표시합니다. 이 프로그램은 다양한 형식의 입력을 받아들이거나 추가 계산을 수행하도록 쉽게 수정할 수 있으므로 기하학적 계산을 위한 다용도 도구가 됩니다. 행렬식의 순위

Nvidia의 차세대 GPU, H100을 깨다 공개! 2024년에 공개된 최초의 3nm 멀티칩 모듈 디자인 Sep 30, 2023 pm 12:49 PM

3nm 공정, H100을 능가하는 성능! 최근 외신 디지타임스는 엔비디아가 차세대 GPU인 B100(코드명 '블랙웰')을 인공지능(AI)과 고성능컴퓨팅(HPC) 애플리케이션용 제품으로 개발 중이라는 소식을 전했다. B100은 TSMC의 3nm 공정 공정과 더욱 복잡한 MCM(멀티 칩 모듈) 설계를 사용하며 2024년 4분기에 출시될 예정입니다. 인공지능 GPU 시장의 80% 이상을 독점하고 있는 엔비디아의 경우, B100을 이용해 철이 뜨거울 때 공격할 수 있고, 이번 AI 배치 물결에서 AMD, 인텔 등 도전자들을 더욱 공격할 수 있다. NVIDIA 추정에 따르면, 2027년까지 이 분야의 출력 가치는 대략적으로 도달할 것으로 예상됩니다.

Java에서 부분 문자열의 발생 횟수를 재귀적으로 계산합니다. Sep 17, 2023 pm 07:49 PM

두 개의 문자열 str_1과 str_2가 주어졌습니다. 목표는 재귀 프로시저를 사용하여 문자열 str1에서 하위 문자열 str2의 발생 횟수를 계산하는 것입니다. 재귀 함수는 정의 내에서 자신을 호출하는 함수입니다. str1이 "Iknowthatyouknowthatiknow"이고 str2가 "know"인 경우 발생 횟수는 -3입니다. 예를 들어 str1="TPisTPareTPamTP", str2="TP"를 입력하면 Countofoccurrencesofasubstringrecursi가 출력됩니다.

C#에서 Math.Pow 함수를 사용하여 지정된 숫자의 거듭제곱을 계산하는 방법 Nov 18, 2023 am 11:32 AM

C#에는 많은 수학 함수가 포함된 Math 클래스 라이브러리가 있습니다. 여기에는 지정된 숫자의 거듭제곱을 계산하는 데 도움이 되는 거듭제곱을 계산하는 Math.Pow 함수가 포함됩니다. Math.Pow 함수의 사용법은 매우 간단합니다. 밑수와 지수만 지정하면 됩니다. 구문은 다음과 같습니다. Math.Pow(base,expont); 여기서 base는 밑수를 나타내고 지수는 지수를 나타냅니다. 이 함수는 double형 결과, 즉 거듭제곱 계산 결과를 반환합니다. 하자

See all articles

경량 시각적 네트워크의 새로운 백본: 효율적인 푸리에 연산자 토큰 믹서

1. 배경

2. : 경량, 글로벌, 적응형

3. AFFNet: 경량 시각적 네트워크의 새로운 백본

4 실험 결과

5. 결론

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제