批處理：理論和張量實現-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

批處理：理論和張量實現

Joseph Gordon-Levitt

Mar 06, 2025 am 11:00 AM

深度神經網絡訓練通常會面臨諸如消失/爆炸梯度和內部協變量轉移，減慢訓練和阻礙學習的障礙。歸一化技術提供了解決方案，批次歸一化（BN）特別突出。 BN可以加速收斂，提高穩定性並增強許多深度學習體系結構的概括。本教程解釋了BN的機制，其數學基礎和Tensorflow/keras實現。機器學習中的

歸一化標準化輸入數據，使用最小 - 最大縮放，z得分歸一化和對數轉換的日誌轉換等方法。這可以減輕異常效應，改善收斂性並確保合理的特徵比較。歸一化數據可確保對學習過程的同等特徵貢獻，從而防止大規模特徵主導並導致次優模型性能。它允許模型更有效地識別有意義的模式。

深度學習培訓挑戰包括：

內部協變量偏移：激活分佈在訓練期間跨層的分佈變化，妨礙適應和學習。
消失/爆炸梯度：梯度在反向傳播過程中變得太小或太大，阻礙了有效的重量更新。
初始權重影響訓練；初始化差會導致收斂速度緩慢或失敗。

批量歸一化在訓練過程中，在微型批次中的一層激活歸一化。它計算每個特徵的激活的平均值和方差，然後使用這些統計數據進行歸一化。可學習的參數（γ和β）尺度並移動歸一化激活，從而使模型可以學習最佳的激活分佈。

Batch Normalization: Theory and TensorFlow Implementation 來源：Yintai MA和Diego Klabjan。通常在層的線性轉換（例如，在完全連接的層中的矩陣乘法或卷積層中的捲積）和非線性激活函數（例如relu）之前應用

bn。關鍵組件是迷你批次統計（平均值和方差），標準化以及使用可學習參數的縮放/移動。

bn通過在每個迷你批次內進行歸一化激活來解決內部協變量的轉移，從而使對後續層的輸入更加穩定。這使得可以更快地通過更高的學習率收斂並降低初始化敏感性。它還正規化，通過減少對特定激活模式的依賴性來防止過度擬合。

批准的數學：

>BN在訓練和推理過程中以不同的方式運行。

訓練：

平均值（μb ）和方差（σ_b2 ^{），在微型批次中為每個特徵計算出：}>

Batch Normalization: Theory and TensorFlow Implementation

激活（x _i）已歸一化：

Batch Normalization: Theory and TensorFlow Implementation

（ε是數值穩定性的小常數）。

縮放和變化：可學習的參數γ和β尺度和移位：

Batch Normalization: Theory and TensorFlow Implementation

>推論：批量統計量被使用移動平均值（動量因子α）計算的運行統計（運行均值和方差）替代：>

Batch Normalization: Theory and TensorFlow Implementation

Batch Normalization: Theory and TensorFlow Implementation 這些運行統計數據和學習的γ和β在推斷期間用於歸一化。

tensorflow實現：

實現注意事項：

import tensorflow as tf
from tensorflow import keras

# Load and preprocess MNIST data (as described in the original text)
# ...

# Define the model architecture
model = keras.Sequential([
    keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    keras.layers.BatchNormalization(),
    keras.layers.Conv2D(64, (3, 3), activation='relu'),
    keras.layers.BatchNormalization(),
    keras.layers.MaxPooling2D((2, 2)),
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.BatchNormalization(),
    keras.layers.Dense(10, activation='softmax')
])

# Compile and train the model (as described in the original text)
# ...

登入後複製

放置：線性變換和激活功能之前。 >

較大的批量尺寸提供更準確的批處理統計信息。 > 正則化： bn引入正則化效果。
限制和挑戰：

> bn的有效性降低了。小批量尺寸：

可靠的批處理統計量較低。

計算開銷：增加內存和訓練時間。

緩解限制：變體和擴展：

：批處理是一種有力的技術，可改善深度神經網絡訓練。記住其優勢，實施細節和限制，並考慮其項目在您的項目中的最佳性能。

以上是批處理：理論和張量實現的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1655

CakePHP 教程

1413

Laravel 教程

1306

PHP教程

1252

C# 教程

1226

Related knowledge

開始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2：多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2，這是AI的重大進步，具有強大的視覺功能和針對移動設備優化的輕量級文本模型。以成功為基礎

10個生成AI編碼擴展，在VS代碼中，您必須探索 Apr 13, 2025 am 01:14 AM

嘿，編碼忍者！您當天計劃哪些與編碼有關的任務？在您進一步研究此博客之前，我希望您考慮所有與編碼相關的困境，這是將其列出的。完畢？ - 讓＆＃8217

AV字節：Meta＆＃039; llama 3.2，Google的雙子座1.5等 Apr 11, 2025 pm 12:01 PM

本週的AI景觀：進步，道德考慮和監管辯論的旋風。 OpenAI，Google，Meta和Microsoft等主要參與者已經釋放了一系列更新，從開創性的新車型到LE的關鍵轉變

向員工出售AI策略：Shopify首席執行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。這不是短暫的趨勢。這是整合到P中的新操作範式

GPT-4O vs OpenAI O1：新的Openai模型值得炒作嗎？ Apr 13, 2025 am 10:18 AM

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力，使其可以通過問題進行思考

視覺語言模型（VLMS）的綜合指南 Apr 12, 2025 am 11:58 AM

介紹想像一下，穿過美術館，周圍是生動的繪畫和雕塑。現在，如果您可以向每一部分提出一個問題並獲得有意義的答案，該怎麼辦？您可能會問：“您在講什麼故事？

如何在SQL中添加列？ - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表語句：動態地將列添加到數據庫在數據管理中，SQL的適應性至關重要。需要即時調整數據庫結構嗎？ Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

閱讀AI索引2025：AI是您的朋友，敵人還是副駕駛？ Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它：認知（了解正在發生的事情）、欣賞（看到好處）、接納（面對挑戰）和責任（弄清我們的責任）。認知：人工智能無處不在，並且發展迅速我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進，在數學和復雜思維測試中取得了優異的成績，而就在一年前，它們還在這些測試中慘敗。想像一下，人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

See all articles

批處理：理論和張量實現

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題