저장 및 전송 효율성을 향상시키는 방법은 무엇입니까? 매개변수 집약적인 마스크 네트워크는 상당한 효과를 발휘합니다.
최근에는 보다 복잡한 작업을 처리하기 위해 신경망의 규모가 커지고 있으며, 신경망을 어떻게 효율적으로 저장하고 전송할 것인지가 매우 중요해졌습니다. 한편, LTH(복권 가설)의 제안을 통해 최근 무작위 희소 신경망이 강력한 잠재력을 보여주었습니다. 이 잠재력을 사용하여 네트워크의 저장 및 전송 효율성을 향상시키는 방법도 연구해 볼 가치가 있습니다.
Northeastern University와 Rochester Institute of Technology의 연구원들은 PEMN(매개변수 효율적인 마스킹 네트워크)을 제안했습니다. 저자는 먼저 제한된 수의 난수로 생성된 확률론적 네트워크의 표현 기능을 탐색합니다. 실험에 따르면 네트워크가 제한된 수의 난수로 생성되더라도 다양한 하위 네트워크 구조를 선택하여 여전히 좋은 표현 기능을 가지고 있는 것으로 나타났습니다.
이 탐색 실험을 통해 저자는 자연스럽게 제한된 수의 난수를 프로토타입으로 사용하고 마스크 세트와 결합하여 신경망을 표현하자고 제안했습니다. 제한된 수의 난수와 바이너리 마스크는 저장 공간을 거의 차지하지 않기 때문에 저자는 이를 활용하여 네트워크 압축에 대한 새로운 아이디어를 제안합니다. 이 기사는 NeurIPS 2022에 채택되었습니다. 코드는 오픈소스로 공개되었습니다.
- 문서 주소: https://arxiv.org/abs/2210.06699
- 문서 코드: https://github.com/yueb17/PEMN
1. 관련 연구
MIT 연구진은 복권 가설(ICLR'19)을 제안했습니다. 무작위로 초기화된 네트워크에는 단독으로 훈련했을 때 좋은 결과를 얻는 복권 하위 네트워크(당첨 티켓)가 있습니다. 복권 가설은 확률적 희소 네트워크의 훈련 가능성을 탐구합니다. Uber 연구진은 Supermask(NeurIPS'19)를 제안했습니다. 무작위로 초기화된 네트워크에는 훈련 없이 직접 추론에 사용할 수 있는 하위 네트워크가 있습니다. Supermask는 확률론적 희소 네트워크의 유용성을 탐구합니다. 워싱턴 대학의 연구원들은 역전파를 통해 하위 네트워크의 마스크를 학습하는 Edge-Popup(CVPR'20)을 제안했습니다. 이는 무작위 희소 네트워크의 유용성을 크게 향상시킵니다.
2. 연구 동기/과정
위의 관련 연구에서는 유용성이 표현 능력으로도 이해될 수 있는 훈련 가능성 및 유용성과 같은 다양한 각도에서 무작위 희소 네트워크의 잠재력을 탐구했습니다. 이 연구에서 저자는 난수로부터 생성된 신경망이 훈련 가중치 없이 얼마나 잘 표현될 수 있는지에 관심이 있습니다. 이 문제를 탐구한 후 저자는 PEMN(Parameter-Efficient Masking Networks)을 제안했습니다. 당연히 저자는 PEMN을 사용하여 네트워크 압축에 대한 새로운 아이디어를 제공하고 PEMN의 잠재적인 응용 시나리오를 탐색하는 예제 역할을 합니다.
3. 난수로 구성된 신경망의 표현 능력 탐색
랜덤 네트워크가 주어지면 저자는 표현 능력을 탐색하기 위해 하위 네트워크를 선택하기 위해 Edge-Popup 알고리즘을 선택합니다. 차이점은 전체 네트워크를 무작위로 초기화하는 대신 저자는 프로토타입을 사용하여 무작위 네트워크를 구축하는 세 가지 매개변수 집약적인 네트워크 생성 전략을 제안합니다.
- One-layer: 네트워크에서 반복되는 구조의 가중치를 프로토타입으로 선택하여 동일한 구조로 다른 네트워크 레이어를 채웁니다.
- 최대 레이어 패딩(MP): 매개변수 수가 가장 많은 네트워크 레이어를 프로토타입으로 선택하고 해당 매개변수 양을 잘라서 다른 네트워크 레이어를 채웁니다.
- 랜덤 벡터 패딩(RP): 특정 길이의 랜덤 벡터를 프로토타입으로 선택하고 복사하여 네트워크 전체를 채웁니다.
세 가지 다른 무작위 네트워크 생성 전략은 네트워크의 고유 값 수를 점차적으로 줄입니다. 서로 다른 전략으로 얻은 무작위 네트워크를 기반으로 하위 네트워크를 선택하여 제한된 수의 난수를 탐색합니다. 생성된 무작위 네트워크의
위 그림은 ConvMixer와 ViT 네트워크를 이용한 CIFAR10 이미지 분류 실험 결과를 보여줍니다. Y축은 정확도이고, X축은 다양한 전략을 사용하여 얻은 무작위 네트워크입니다. 다음과 같이
실험 결과에 따르면, 무작위 네트워크에 매우 제한된 수의 비반복 난수(예: PR_1e-3)만 있어도 선택한 하위 네트워크의 표현 능력을 잘 유지할 수 있음을 관찰했습니다. . 지금까지 저자는 다양한 난수 네트워크 생성 전략을 통해 제한된 수의 난수로 구성된 신경망의 표현 능력을 탐색했으며, 반복되지 않는 난수가 매우 제한되어 있어도 해당 난수 네트워크가 여전히 표현할 수 있음을 관찰했습니다. 데이터 잘.
동시에 이러한 무작위 네트워크 생성 전략을 기반으로 하고 획득한 하위 네트워크 마스크를 결합하여 저자는 PEMN(Parameter-Efficient Masking Networks)이라는 새로운 신경망 유형을 제안했습니다.
4. 새로운 네트워크 압축 아이디어
이 기사에서는 PEMN의 잠재적인 응용을 확장하기 위한 예로 신경망 압축을 선택합니다. 특히, 이 기사에서 제안된 다양한 무작위 네트워크 생성 전략은 프로토타입을 효율적으로 사용하여 완전한 무작위 네트워크, 특히 가장 세분화된 무작위 벡터 패딩(RP) 전략을 나타낼 수 있습니다.
저자는 RP 전략의 무작위 벡터 프로토타입과 해당 하위 네트워크 마스크 세트를 사용하여 무작위 네트워크를 나타냅니다. 프로토타입은 부동 소수점 형식으로 저장해야 하고 마스크는 이진 형식으로만 저장하면 됩니다. RP의 프로토타입 길이가 매우 짧을 수 있기 때문에(반복되지 않는 제한된 수의 난수는 여전히 강력한 표현 능력을 갖기 때문에) 신경망을 표현하는 오버헤드는 매우 작아질 것입니다. 제한된 길이. 임의의 벡터와 이진 형식의 마스크 세트. 본 논문에서는 서브네트워크의 부동 소수점 값을 저장하는 기존의 희소 네트워크와 비교하여 신경망을 효율적으로 저장하고 전송하기 위한 새로운 네트워크 압축 아이디어를 제안합니다.
위 그림에서 저자는 PEMN을 사용하여 네트워크를 압축하고 이를 기존 네트워크 가지치기 방법과 비교합니다. 실험에서는 ResNet 네트워크를 사용하여 CIFAR 데이터 세트에 대한 이미지 분류 작업을 수행합니다. 새로운 압축 방식은 일반적으로 기존 네트워크 가지치기보다 더 나은 성능을 발휘합니다. 특히 매우 높은 압축률에서 PEMN은 여전히 우수한 정확도를 유지할 수 있습니다.
5. 결론
이 논문은 최근 무작위 네트워크가 보여준 잠재력에 영감을 받아 무작위 신경망을 구축하기 위한 다양한 매개변수 집약적 전략을 제안하고, 반복되지 않는 제한된 숫자만 있을 때 생성되는 방법을 탐색합니다. 무작위 신경망의 표현 가능성과 PEMN(Parameter-Efficient Masking Networks)이 제안되었습니다. 저자는 PEMN을 네트워크 압축 시나리오에 적용하여 실제 애플리케이션에서의 잠재력을 탐색하고 네트워크 압축에 대한 새로운 아이디어를 제공합니다. 저자는 무작위 네트워크에 매우 제한된 수의 반복되지 않는 난수가 있는 경우에도 하위 네트워크 선택을 통해 여전히 우수한 표현 기능을 가지고 있음을 보여주는 광범위한 실험을 제공합니다. 또한 기존 프루닝 알고리즘과 비교하여 실험을 통해 새로 제안된 방법이 더 나은 네트워크 압축 효과를 달성할 수 있음을 보여줌으로써 이 시나리오에서 PEMN의 적용 가능성을 검증했습니다.
위 내용은 저장 및 전송 효율성을 향상시키는 방법은 무엇입니까? 매개변수 집약적인 마스크 네트워크는 상당한 효과를 발휘합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











이 웹사이트는 3월 7일 화웨이의 데이터 스토리지 제품 라인 사장인 Zhou Yuefeng 박사가 최근 MWC2024 컨퍼런스에 참석하여 웜 데이터(WarmData)와 콜드 데이터(ColdData)용으로 설계된 차세대 OceanStorArctic 자전 스토리지 솔루션을 구체적으로 시연했다고 보도했습니다. Huawei의 데이터 스토리지 제품 라인 사장 Zhou Yuefeng은 일련의 혁신적인 솔루션을 출시했습니다. 이미지 출처: 이 사이트에 첨부된 Huawei의 공식 보도 자료는 다음과 같습니다. 이 솔루션의 가격은 자기 테이프보다 20% 저렴하며, 전력 소비는 하드 디스크보다 90% 낮습니다. 해외 기술 매체인 blockandfiles에 따르면, Huawei 대변인은 자기전기 저장 솔루션에 대한 정보도 공개했습니다. Huawei의 자기전자 디스크(MED)는 자기 저장 매체의 주요 혁신입니다. 1세대 ME

Vue3+TS+Vite 개발 팁: 데이터를 암호화하고 저장하는 방법 인터넷 기술의 급속한 발전으로 인해 데이터 보안 및 개인 정보 보호가 점점 더 중요해지고 있습니다. Vue3+TS+Vite 개발 환경에서 데이터를 암호화하고 저장하는 방법은 모든 개발자가 직면해야 하는 문제입니다. 이 기사에서는 개발자가 애플리케이션 보안 및 사용자 경험을 개선하는 데 도움이 되는 몇 가지 일반적인 데이터 암호화 및 저장 기술을 소개합니다. 1. 데이터 암호화 프런트엔드 데이터 암호화 프런트엔드 암호화는 데이터 보안을 보호하는 중요한 부분입니다. 일반적으로 사용되는

캐시란 무엇입니까? 캐시(ka·shay로 발음)는 자주 요청되는 데이터 및 지침을 저장하는 데 사용되는 특수 고속 하드웨어 또는 소프트웨어 구성 요소로, 웹 사이트, 애플리케이션, 서비스 및 기타 시스템 측면을 더 빠르게 로드하는 데 사용할 수 있습니다. . 캐싱을 사용하면 가장 자주 액세스하는 데이터를 쉽게 사용할 수 있습니다. 캐시 파일은 캐시 메모리와 동일하지 않습니다. 캐시 파일은 여러 프로그램에서 필요할 수 있는 PNG, 아이콘, 로고, 셰이더 등과 같이 자주 필요한 파일을 의미합니다. 이러한 파일은 일반적으로 숨겨져 있는 실제 드라이브 공간에 저장됩니다. 반면에 캐시 메모리는 주 메모리 및/또는 RAM보다 빠른 메모리 유형입니다. CPU에 더 가깝고 RAM에 비해 빠르기 때문에 데이터 액세스 시간을 크게 줄입니다.

Git은 빠르고 안정적이며 적응력이 뛰어난 분산 버전 제어 시스템입니다. 분산된 비선형 워크플로를 지원하도록 설계되어 모든 규모의 소프트웨어 개발 팀에 이상적입니다. 각 Git 작업 디렉터리는 모든 변경 사항에 대한 전체 기록을 보유하고 네트워크 액세스나 중앙 서버 없이도 버전을 추적할 수 있는 독립적인 저장소입니다. GitHub는 분산 개정 제어의 모든 기능을 제공하는 클라우드에 호스팅되는 Git 저장소입니다. GitHub는 클라우드에서 호스팅되는 Git 저장소입니다. CLI 도구인 Git과 달리 GitHub에는 웹 기반 그래픽 사용자 인터페이스가 있습니다. 이는 다른 개발자와 협력하고 스크립트 변경 사항을 추적하는 버전 제어에 사용됩니다.

sessionStorage를 올바르게 사용하여 민감한 정보를 저장하려면 특정 코드 예제가 필요합니다. 웹 개발이든 모바일 애플리케이션 개발이든 사용자 로그인 자격 증명, ID 번호 등과 같은 민감한 정보를 저장하고 처리해야 하는 경우가 많습니다. 프런트엔드 개발에서는 sessionStorage를 사용하는 것이 일반적인 스토리지 솔루션입니다. 그러나 sessionStorage는 브라우저 기반 스토리지이기 때문에 저장된 민감한 정보가 악의적으로 접근 및 사용되지 않도록 몇 가지 보안 문제에 주의가 필요합니다.

일상 생활과 업무에서 비디오 파일을 서로 전송하기 위해 컴퓨터 장치와 모바일 장치를 사용해야 하는 경우가 많습니다. 그러나 수신 측의 비디오 파일은 전송 중 압축으로 인해 발생하기 쉽습니다. 이러한 상황을 방지하는 방법과 파일을 무손실로 전송하는 방법은 무엇입니까? EV 화면 녹화 소프트웨어를 사용하여 휴대폰에 녹화된 비디오 파일을 무손실 및 압축되지 않은 형식으로 컴퓨터에 전송하여 재생할 수 있습니다. 아래에서 관련 튜토리얼을 가져오겠습니다. 도움이 되기를 바랍니다. 화면 녹화 파일을 휴대폰으로 무손실 전송하는 방법의 첫 번째 단계는 휴대폰에 EV 화면 녹화 소프트웨어를 다운로드한 다음 홈페이지에서 "툴킷"을 클릭하고 "WiFi 전송" 기능을 찾는 것입니다. 두 번째 단계는 포기하는 것입니다

PHP와 Swoole은 어떻게 효율적인 데이터 캐싱 및 저장을 달성합니까? 개요: 웹 애플리케이션 개발에서 데이터 캐싱 및 저장은 매우 중요한 부분입니다. PHP와 Swoole은 데이터를 캐시하고 저장하는 효율적인 방법을 제공합니다. 이 기사에서는 PHP와 Swoole을 사용하여 효율적인 데이터 캐싱 및 저장을 달성하는 방법을 소개하고 해당 코드 예제를 제공합니다. 1. swoole 소개: swoole은 PHP 언어용으로 개발된 고성능 비동기 네트워크 통신 엔진입니다.

이 기사는 WeChat 공개 계정 "정보 시대에 살기"에서 재인쇄되었습니다. 저자는 정보 시대에 살고 있습니다. 이 기사를 재인쇄하려면 Living in the Information Age 공개 계정에 문의하세요. 데이터베이스 작업에 익숙한 학생들에게는 멋진 SQL 문을 작성하고 데이터베이스에서 필요한 데이터를 찾는 방법을 찾는 것이 일상적인 작업입니다. 머신러닝에 익숙한 학생들에게는 데이터를 얻고, 데이터를 전처리하고, 모델을 구축하고, 훈련 세트와 테스트 세트를 결정하고, 훈련된 모델을 사용하여 미래에 대한 일련의 예측을 하는 것도 일상적인 작업입니다. 그렇다면 두 기술을 결합할 수 있을까요? 데이터는 데이터베이스에 저장되어 있으며 예측은 과거 데이터를 기반으로 해야 한다는 것을 알 수 있습니다. 데이터베이스에 존재하는 데이터를 통해 미래의 데이터를 쿼리하면,
