'스파스 코딩'은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함-일체 포함-php.cn

실험 결과

집

기술 주변기기

일체 포함

'스파스 코딩'은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 09:46 PM

코딩 매개변수

심층 신경망은 이미지 분류에 있어 강력한 경험적 성능을 갖고 있지만 이러한 모델은 종종 "블랙박스"로 간주되며 "설명하기 어렵다"는 이유로 가장 비판을 받습니다.

반대로 희소 컨벌루션 모델은 신호가 컨볼루셔널 사전에 있는 여러 요소의 선형 조합으로 구성될 수 있다고 가정하는 자연 이미지를 분석하는 강력한 도구이기도 합니다. 해석 가능성 및 생물학적 타당성.

실제 응용에서는 희소 컨볼루션 모델이

원칙적으로 작동하더라도 경험적으로 설계된 딥 네트워크에 비해 마땅한 성능 이점을 보여주지 않습니다.

최근

Ma Yi 교수 연구 그룹은 NeurIPS 2022에서 이미지 분류에 희소 컨볼루션 모델의 적용을 검토하는 새로운 논문을 발표했으며, 희소 컨볼루션 모델의 실증적 성능과 신뢰성을 성공적으로 해결했습니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

문서 링크: https://arxiv.org/pdf/2210.12945.pdf

코드 링크: https://github.com/Delay-Xili/SDNet

기사에서 제안한

미분화 가능한 최적화 계층은 표준 quasi-convolutional 계층을 대체하기 위해 CSC(Convolutional Sparse Coding) 을 사용합니다.

결과에 따르면 기존 신경망과 비교할 때 이러한 모델은 CIFAR-10, CIFAR-100 및 ImageNet 데이터 세트에서 똑같이 강력한 경험적 성능을 나타냅니다.

희소 모델링의 강력한 복구 특성을 활용함으로써 연구원들은 희소 정규화와 데이터 재구성 항 사이의 간단하고 적절한 절충만으로 이러한 모델이 입력 손상에서 살아남을 수 있을 뿐만 아니라

적대적인 섭동이 더 강력하다는 것을 보여줍니다. .

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

Ma Yi 교수는 1995년 칭화대학교에서 자동화 및 응용수학 복수학사 학위를 취득한 후, 미국 버클리 캘리포니아대학교에서 수학하고, 1997년 EECS에서 석사학위를 받았습니다. 수학 석사 학위를 취득하고 2000년 이학사 학위를 취득하여 EECS 박사 학위를 취득했습니다.

졸업 후 일리노이 대학교 어바나-샴페인에서 가르쳤으며 전기컴퓨터공학과 역사상 최연소 부교수가 되었습니다.

2009년에는 Microsoft Research Asia의 Visual Computing Group 선임 연구원으로 재직했습니다. 2014년에 그는 ShanghaiTech University의 정보 과학 기술 대학에 정규직으로 합류했습니다.

2018년 캘리포니아 대학교 버클리 캠퍼스와 칭화-버클리 심천 연구소에 합류했습니다. 현재 버클리 대학교 전기 공학 및 컴퓨터 과학과 교수로 재직하고 있으며 ACM의 IEEE 펠로우이기도 합니다. Fellow, SIAM Fellow

Ma Yi 교수의 연구 관심분야는 3D 컴퓨터 비전, 고차원 데이터를 위한 저차원 모델, 확장성 최적화 및 기계 학습입니다. 최근 연구 주제에는 대규모 3D 기하학적 재구성 및 상호 작용이 포함됩니다. 저차원 모델과 심층 네트워크 간의 관계.

Sparse Convolution

심층 컨볼루션 네트워크(ConvNets)가 이미지 분류의 주류 방법이 되었고 그 성능이 다른 모델을 능가하지만 컨볼루션, 비선형 함수, 정규화 등과 같은 내부 구성 요소는 데이터는 아직 설명되지 않았습니다.

해석 가능한 표현을 학습하는 능력과 강력한 이론적 보장(예: 손상된 데이터 처리)을 지원하는 희소 데이터 모델링은 많은 신호 및 이미지 처리 응용 프로그램에서 널리 사용되었지만 ImageNet과 같은 데이터에서의 성능은 세트의 분류 성능은 경험적 심층 모델보다 여전히 열등합니다.

강력한 성능을 지닌 희소 모델에도 여전히 결함이 있습니다.

1) 네트워크 구조를 특별히 설계해야 하므로 모델의 적용 가능성이 제한됩니다.

2) 학습 계산 속도는 몇 배입니다.

3) 해석성과 견고성 측면에서 뚜렷한 이점을 보여주지 않습니다.

연구원들은 본 논문에서 시각적 인식 프레임워크를 제안하여 레이어 입력이 모든 데이터 포인트가 공유하는 사전의 몇 개의 원자로 구성될 수 있다는 가정하에 간단한 설계를 통해 희소 모델링이 딥러닝과 결합될 수 있음을 입증했습니다. (atom)을 사용하여 표준 ConvNet과 동일한 성능을 달성하는 동시에 더 나은 계층적 해석성과 안정성을 제공합니다.

이 방법은 암시적 레이어에 희소 모델링을 캡슐화하고 이를 표준 ConvNet의 컨벌루션 레이어 대신 사용합니다.

전통적인 완전 연결 또는 컨벌루션 계층에서 사용되는 명시적 함수와 관련하여 숨겨진 계층은 암시적 함수를 사용합니다. 본 논문에서 은닉층은 계층의 입력변수와 가중치 매개변수의 최적화 문제를 기반으로 정의되며, 은닉층의 출력은 최적화 문제의 해결책이다.

다차원 입력 신호가 주어지면 더 나은 희소 출력으로 역 매핑을 수행하도록 레이어의 기능을 정의할 수 있으므로 출력 채널 수가 입력과 다를 수 있으므로 위의 Lasso가 최적입니다. 유형 최적화 문제는 희소 솔루션에서 찾을 수 있습니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

이 히든 레이어는 CSC(Convolutional Sparse Coding) 모델을 구현합니다. 여기서 입력 신호는 컨볼루셔널 사전에 있는 원자의 희소 선형 조합으로 근사화됩니다. 이 컨벌루션 사전은 역전파를 통해 훈련되는 CSC 계층의 매개변수로 간주될 수 있습니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

CSC 모델의 목표는 A(z) 연산자를 통해 입력 신호를 재구성하는 것입니다. 여기서 특징 맵 z는 A에서 컨볼루션 필터의 위치와 값을 지정합니다. 모델링 차이를 허용하기 위해 재구성이 정확할 필요는 없습니다.

결정된 CSC 계층의 입출력 매핑을 기반으로 해당 최적화를 해결하여 순방향 전파를 수행할 수 있으며, 입력 x와 매개변수에 대한 최적 계수 해의 기울기를 구하여 역전파를 수행할 수 있습니다. ㅏ .

그런 다음 교차 엔트로피 손실을 최소화하여 종단 간 방식으로 레이블이 지정된 데이터에서 CSC 계층이 있는 전체 네트워크를 훈련할 수 있습니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

실험 결과

분류 성능 비교

실험에 사용된 데이터 세트는 CIFAR-10과 CIFAR-100이며, 각 데이터 세트에는 50,000개의 학습 이미지가 포함되어 있습니다. 그리고 10,000 테스트 이미지에서는 각 이미지의 크기가 32×32이고 RGB 채널이 있습니다.

표준 네트워크 아키텍처인 ResNet-18 및 ResNet-34와 방법을 비교한 것 외에도 연구원들은 숨겨진 계층 아키텍처가 있는 MDEQ 모델 및 희소 모델링 아키텍처가 있는 SCN과도 비교했습니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

실험 결과, 유사한 모델 규모에서 SDNet-18/34의 Top-1 정확도는 ResNet-18/34와 비슷하거나 높으며 추론 속도도 비슷하다는 것을 알 수 있습니다. 결과는 SDNet 모델이 손상된 이미지를 처리하는 데 추가 이점을 갖고 있기 때문에 기존 데이터 기반 모델에 대한 강력한 대안으로서 이 네트워크의 잠재력을 보여줍니다.

SDNet-18 모델을 유사한 모델 크기의 MDEQ 모델과 비교한 결과, SDNet-18이 MDEQ보다 정확할 뿐만 아니라 훨씬 더 빠르다는 것을 알 수 있습니다(>7배). MDEQ는 SDNet처럼 손상된 데이터를 처리할 수 없다는 점에 유의해야 합니다.

SCN 네트워크도 희소 모델링을 사용하여 Top-1 정확도를 달성했지만 SCN의 중요한 단점은 훈련 속도가 매우 느리다는 것입니다. 그 이유는 SCN이 패치 기반 희소 코딩 모델을 사용하기 때문일 수 있습니다. 이미지의 경우 컨벌루션 희소 코딩 모델과 비교하여 각 순방향 패스에서 더 많은 희소 코딩 문제를 해결해야 하며 병렬 컴퓨팅의 이점을 얻을 수 없습니다.

입력 섭동에 대한 강력한 추론 처리

입력 섭동에 대한 방법의 견고성을 테스트하기 위해 연구원들은 CIFAR-10-C 데이터 세트를 사용했습니다. 여기서 데이터는 다양한 유형의 합성 잡음과 심하게 손상되었습니다.

모델의 CSC 레이어는 입력 신호와 재구성된 신호 사이의 입력별 차이에 페널티를 주기 때문에 이론적으로 SDNet은 추가 노이즈 처리에 더 적합해야 합니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

그래서 실험 부분에서는 주로 CIFAR-10-C의 4가지 유형의 추가 노이즈인 가우시안 노이즈, 샷 노이즈, 스펙클 노이즈 및 임펄스 노이즈에 중점을 두고 SDNet-18의 정확도를 평가합니다. ResNet-18과 성능을 비교합니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

다양한 유형의 노이즈와 다양한 심각도(레벨 0, 1, 2의 임펄스 노이즈 제외)에 대해 훈련 중에 사용된 값과 다른 λ 값을 적절하게 선택하면 테스트 성능을 향상시키는 데 도움이 될 수 있음을 알 수 있습니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

특히 λ의 함수인 정확도 곡선은 성능이 먼저 증가했다가 감소하는 단봉 모양을 나타냅니다. 또한 각 데이터 손상 유형에서 성능 최고점에 도달하는 람다 값은 손상 심각도에 따라 단조롭게 증가하며 이는 예상과 일치하는 관찰입니다.

적대적 섭동 처리

연구원들은 PGD를 사용하여 CIFAR-10 테스트 데이터 세트의 SDNet(λ=0.1)에서 적대적 섭동을 생성했습니다. 섭동의 Lπ 패러다임은 8/255입니다. 섭동 L2 정규형은 0.5입니다.

스파스 코딩은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

ResNet-18과 비교하면 λ=0.1의 경우 SDNet의 성능은 ResNet보다 크게 뛰어나지는 않지만 매개변수 λ를 조정하면 견고성 정확도가 크게 향상될 수 있음을 알 수 있습니다. .

위 내용은 '스파스 코딩'은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7465

Cakephp 튜토리얼

1376

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

PHP 버전 5.4의 새로운 기능: 호출 가능 유형 힌트 매개변수를 사용하여 호출 가능 함수 또는 메서드를 허용하는 방법 Jul 29, 2023 pm 09:19 PM

PHP5.4 버전의 새로운 기능: 호출 가능 유형 힌트 매개변수를 사용하여 호출 가능 함수 또는 메소드를 허용하는 방법 소개: PHP5.4 버전에는 매우 편리한 새 기능이 도입되었습니다. 호출 가능 유형 힌트 매개변수를 사용하여 호출 가능 함수 또는 메소드를 허용할 수 있습니다. 이 새로운 기능을 사용하면 함수와 메서드가 추가 확인 및 변환 없이 해당 호출 가능 매개변수를 직접 지정할 수 있습니다. 이 기사에서는 호출 가능 유형 힌트의 사용을 소개하고 몇 가지 코드 예제를 제공합니다.

제품 매개변수는 무엇을 의미합니까? Jul 05, 2023 am 11:13 AM

제품 매개변수는 제품 속성의 의미를 나타냅니다. 예를 들어 의류 매개변수에는 브랜드, 소재, 모델, 크기, 스타일, 직물, 적용 그룹, 색상 등이 포함됩니다. 식품 매개변수에는 브랜드, 중량, 재료, 건강 허가 번호, 적용 그룹, 색상 등이 포함됩니다. 브랜드, 크기, 색상, 원산지, 적용 가능한 전압, 신호, 인터페이스 및 전원 등이 포함됩니다.

i9-12900H 매개변수 평가 목록 Feb 23, 2024 am 09:25 AM

i9-12900H는 14코어 프로세서로, 사용된 아키텍처와 기술이 모두 새롭고, 전반적인 작업이 매우 뛰어나며, 특히 포괄적이며 사용자에게 뛰어난 경험을 제공할 수 있습니다. . i9-12900H 매개변수 평가 검토: 1. i9-12900H는 14코어 프로세서로, q1 아키텍처와 24576kb 프로세스 기술을 채택하고 20스레드로 업그레이드되었습니다. 2. 최대 CPU 주파수는 1.80!5.00ghz이며 주로 작업량에 따라 다릅니다. 3. 가격에 비해 가격 대비 성능이 매우 적합하며 정상적인 사용이 필요한 일부 파트너에게 매우 적합합니다. i9-12900H 매개변수 평가 및 성능 벤치마크

지식 그래프: 대형 모델을 위한 이상적인 파트너 Jan 29, 2024 am 09:21 AM

LLM(대형 언어 모델)은 매끄럽고 일관된 텍스트를 생성하는 기능을 갖추고 있어 인공 지능 대화 및 창의적 글쓰기와 같은 영역에 새로운 전망을 제시합니다. 그러나 LLM에는 몇 가지 주요 제한 사항도 있습니다. 첫째, 그들의 지식은 훈련 데이터에서 인식된 패턴으로 제한되어 있으며 세상에 대한 진정한 이해가 부족합니다. 둘째, 추론 능력이 제한되어 있어 여러 데이터 소스에서 논리적 추론을 하거나 사실을 융합할 수 없습니다. 더 복잡하고 개방형 질문에 직면할 때 LLM의 답변은 "환상"이라고 알려진 터무니없거나 모순될 수 있습니다. 따라서 LLM은 일부 측면에서 매우 유용하지만 복잡한 문제와 실제 상황을 처리할 때 여전히 특정 제한 사항이 있습니다. 이러한 격차를 해소하기 위해 최근 몇 년 동안 검색 증강 생성(RAG) 시스템이 등장했습니다.

C++ 함수 매개변수 유형 안전성 확인 Apr 19, 2024 pm 12:00 PM

C++ 매개변수 유형 안전성 검사는 함수가 컴파일 시간 검사, 런타임 검사 및 정적 어설션을 통해 예상된 유형의 값만 허용하도록 보장하여 예기치 않은 동작 및 프로그램 충돌을 방지합니다. 컴파일 시간 유형 검사: 컴파일러가 유형 호환성을 검사합니다. 런타임 유형 검사: 동적_캐스트를 사용하여 유형 호환성을 확인하고 일치하는 항목이 없으면 예외를 발생시킵니다. 정적 어설션: 컴파일 타임에 유형 조건을 어설션합니다.

PHP 경고: in_array()에 대한 솔루션에는 매개변수가 필요합니다. Jun 22, 2023 pm 11:52 PM

개발 과정에서 다음과 같은 오류 메시지가 나타날 수 있습니다: PHPWarning: in_array()expectsparameter. 이 오류 메시지는 in_array() 함수를 사용할 때 나타나는데, 이는 함수의 잘못된 매개변수 전달로 인해 발생할 수 있습니다. 이 오류 메시지에 대한 해결 방법을 살펴보겠습니다. 먼저 in_array() 함수의 역할을 명확히 해야 합니다. 즉, 배열에 값이 존재하는지 확인해야 합니다. 이 함수의 프로토타입은 다음과 같습니다: in_a

주어진 값을 인수로 취하는 역쌍곡사인 함수의 값을 찾는 C++ 프로그램 Sep 17, 2023 am 10:49 AM

쌍곡선 함수는 원 대신 쌍곡선을 사용하여 정의되며 일반 삼각 함수와 동일합니다. 제공된 각도(라디안)에서 쌍곡사인 함수의 비율 매개변수를 반환합니다. 그러나 반대로 하십시오. 즉, 반대로 하십시오. 쌍곡선 사인으로부터 각도를 계산하려면 쌍곡선 역사인 연산과 같은 역쌍곡선 삼각법 연산이 필요합니다. 이 과정에서는 라디안 단위의 쌍곡선 사인 값을 사용하여 각도를 계산하기 위해 C++에서 쌍곡선 역사인(asinh) 함수를 사용하는 방법을 보여줍니다. 쌍곡선 아크사인 연산은 다음 공식 -$$\mathrm{sinh^{-1}x\:=\:In(x\:+\:\sqrt{x^2\:+\:1})}을 따릅니다. 여기서\:In\:은\:자연 로그\:(log_e\:k)

몇 가지 일반적인 인코딩 방법 Oct 24, 2023 am 10:09 AM

일반적인 인코딩 방법에는 ASCII 인코딩, 유니코드 인코딩, UTF-8 인코딩, UTF-16 인코딩, GBK 인코딩 등이 포함됩니다. 자세한 소개: 1. ASCII 인코딩은 7비트 이진수를 사용하여 영어 문자, 숫자, 구두점, 제어 문자 등을 포함하여 128개의 문자를 나타내는 최초의 문자 인코딩 표준입니다. 2. 유니코드 인코딩은 표현하는 데 사용되는 방법입니다. 세상의 모든 문자 각 문자에 고유한 디지털 코드 포인트를 할당하는 문자의 표준 인코딩 방법 3. UTF-8 인코딩 등

See all articles

'스파스 코딩'은 이론에서 실습으로 이어집니다! NeurIPS 2022에서 Ma Yi 교수의 새로운 작업: 희소 컨볼루션 성능과 견고성이 ResNet을 능가함

실험 결과

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제