배치 정규화 : 이론 및 텐서 플로 구현-일체 포함-php.cn

집

기술 주변기기

일체 포함

배치 정규화 : 이론 및 텐서 플로 구현

Joseph Gordon-Levitt

Mar 06, 2025 am 11:00 AM

깊은 신경 네트워크 훈련은 종종 사라지거나 폭발하는 그라디언트 및 내부 공변량 이동, 훈련 둔화 및 학습 방해와 같은 장애물에 직면 해 있습니다. 정규화 기술은 배치 정규화 (BN)가 특히 두드러지는 솔루션을 제공합니다. BN은 수렴을 가속화하고 안정성을 향상 시키며 많은 딥 러닝 아키텍처에서 일반화를 향상시킵니다. 이 튜토리얼은 BN의 역학, 수학적 토대 및 Tensorflow/Keras 구현을 설명합니다. 머신 러닝에서의 정규화는 최소-맥스 스케일링, Z- 점수 정규화 및 로그 변환과 같은 방법을 사용하여 입력 데이터를 표준화합니다. 이것은 특이한 효과를 완화하고 수렴을 향상 시키며 공정한 기능 비교를 보장합니다. 정규화 된 데이터는 학습 프로세스에 동일한 기능 기여를 보장하여 대규모 기능이 지배하는 것을 방지하고 최적의 모델 성능을 초래합니다. 모델이 의미있는 패턴을보다 효과적으로 식별 할 수 있습니다.

딥 러닝 교육 문제에는 다음이 포함됩니다

내부 공변량 교대 :

활성화의 분포는 훈련, 적응 및 학습을 방해하는 동안 레이어에 걸쳐 변화합니다. 소실/폭발 기울기 :

변환 중에 그라디언트가 너무 작거나 커져 효과적인 체중 업데이트를 방해합니다.

초기화 감도 :

배치 정규화는 각 미니 배치 내에서 활성화를 정상화하고, 훈련을 안정화하고, 모델 성능을 향상시킴으로써 이들을 다룹니다. 배치 정규화는 훈련 중에 미니 배치 내에서 층의 활성화를 정규화합니다. 각 기능에 대한 활성화의 평균과 분산을 계산 한 다음 이러한 통계를 사용하여 정규화합니다. 학습 가능한 파라미터 (γ 및 β) 스케일 및 정규화 된 활성화를 바꾸어 모델이 최적의 활성화 분포를 배울 수 있도록합니다. 출처 : Yintai MA와 Diego Klabjan bn은 일반적으로 층의 선형 변환 (예를 들어, 완전히 연결된 층의 매트릭스 곱셈 또는 컨볼 루션 층의 컨볼 루션) 및 비선형 활성화 기능 (예 : Relu) 이전에 적용됩니다. 주요 구성 요소는 미니 배치 통계 (평균 및 분산), 정규화 및 학습 가능한 매개 변수로 스케일링/이동입니다. Bn은 각각의 미니 배치 내에서 활성화를 정규화함으로써 내부 공변량 이동을 해결하여 후속 층에 대한 입력을보다 안정적으로 만듭니다. 이를 통해 더 높은 학습 속도로 수렴이 빠르고 초기화 감도를 줄입니다. 또한 특정 활성화 패턴에 대한 의존성을 줄임으로써 과적으로 피해를 방지하여 규칙화합니다.
훈련 및 추론 중에
bn은 다르게 작동합니다
훈련 :
정규화 :
평균 (μ b ) 및 분산 (σ b ))는 미니 배치에서 각 기능에 대해 계산됩니다 : .
- 활성화 (x _i)는 정규화됩니다 (ε는 수치 안정성을 위해 작은 상수입니다) ^{스케일링 및 이동 :} 학습 가능한 매개 변수 γ 및 β 스케일 및 시프트 :
추론 : 배치 통계는 움직이는 평균 (운동량 계수 α)을 사용하여 훈련 중에 계산 된 실행 통계 (실행 평균 및 분산)로 대체됩니다.

이러한 실행 통계 및 학습 된 γ 및 β는 추론 중 정규화에 사용됩니다. 텐서 플로 구현 :
_{구현 고려 사항 :}

배치 : 선형 변환 후 및 활성화 기능 전 배치 크기 : 더 큰 배치 크기는보다 정확한 배치 통계를 제공합니다.
정규화 : bn은 정규화 효과를 소개합니다

제한과 도전 :
비 컨볼 루션 아키텍처 : Bn의 효과는 RNNS 및 변압기에서 감소합니다. 작은 배치 크기 :

Batch Normalization: Theory and TensorFlow Implementation 완화 한계 :

변형 및 확장 : 층 정규화, 그룹 정규화, 인스턴스 정규화, 배치 재 정규화 및 중량 정규화는 특정 요구에 따라 대안 또는 개선을 제공합니다. 결론 :

배치 정규화는 깊은 신경망 훈련을 향상시키는 강력한 기술입니다. 이점, 구현 세부 사항 및 제한 사항을 기억하고 프로젝트에서 최적의 성능을위한 변형을 고려하십시오.

위 내용은 배치 정규화 : 이론 및 텐서 플로 구현의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7888

자바 튜토리얼

1650

Cakephp 튜토리얼

1411

라라벨 튜토리얼

1302

PHP 튜토리얼

1247

Related knowledge

창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) Apr 02, 2025 pm 06:10 PM

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

최고의 AI 챗봇 비교 (Chatgpt, Gemini, Claude & amp; more) Apr 02, 2025 pm 06:09 PM

이 기사는 Chatgpt, Gemini 및 Claude와 같은 최고의 AI 챗봇을 비교하여 고유 한 기능, 사용자 정의 옵션 및 자연어 처리 및 신뢰성의 성능에 중점을 둡니다.

컨텐츠 생성을 향상시키기 위해 AI를 쓰는 최고 AI 작문 Apr 02, 2025 pm 06:11 PM

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.