>本文詳細介紹了使用卷積神經網絡(CNN)和MNIST數據集構建用於手寫數字識別的KERAS模型。 讓我們重新提示它以清晰並改善流程。
>用keras 構建手寫數字識別器
>本教程演示了創建一個模型,使用Python的Keras庫識別手寫數字,這是一種簡化建築和培訓神經網絡的高級API。我們將利用卷積神經網絡(CNN)和廣泛使用的MNIST數據集的力量。
理解方法
我們的模型採用CNN,這是一種特別有效的圖像分類體系結構。與傳統的神經網絡不同,CNNS在3D陣列(X,Y坐標和顏色)中處理數據,使其非常適合圖像數據。 MNIST數據集包含60,000個培訓和10,000個手寫數字的測試示例,為培訓提供了必要的標籤數據。
>人工神經網絡(ANN)和CNNS > ANN是一個數學模型,通過隱藏的圖層將輸入數據轉換為輸出,每個層代表概率。 培訓涉及根據錯誤調整權重和偏見,從而使網絡學習模式。 CNNS為圖像處理提供了重要的優勢。它們的3D陣列結構意味著每個隱藏層節點僅連接到一個小輸入區域,與傳統ANN相比,效率大大提高。 關鍵CNN層包括卷積層(特徵提取),合併層(功能降低),變平層(降低維度)和最終分類層。
>
加載培訓和測試數據。 可視化樣品數字有助於理解數據結構:
mnist.load_data()
from keras.datasets import mnist import matplotlib.pyplot as plt (x_train, y_train), (x_test, y_test) = mnist.load_data() image_index = 35 plt.imshow(x_train[image_index], cmap='Greys') plt.show()
數據預處理
在創建模型之前,數據需要預處理:
.reshape()
>。 y_train
>使用y_test
將因變量(to_categorical()
,from keras.datasets import mnist import matplotlib.pyplot as plt (x_train, y_train), (x_test, y_test) = mnist.load_data() image_index = 35 plt.imshow(x_train[image_index], cmap='Greys') plt.show()
型號設計和訓練
>我們的CNN模型是依次構建的:
img_rows, img_cols = 28, 28 x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) / 255 x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) / 255 y_train = to_categorical(y_train, num_classes=10) y_test = to_categorical(y_test, num_classes=10)
>
sparse_categorical_crossentropy
使用自定義圖像進行測試.fit()
from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D model = Sequential([ Conv2D(32, (3, 3), activation='relu', input_shape=(img_rows, img_cols, 1)), Conv2D(64, (3, 3), activation='relu'), MaxPooling2D((2, 2)), Dropout(0.25), Flatten(), Dense(128, activation='relu'), Dropout(0.5), Dense(10, activation='softmax') # 10 output classes (digits 0-9) ])
為了測試模型,我們加載自定義手寫數字圖像,預處理(轉換為灰度,重塑,歸一化),加載保存的模型並使用>進行分類。
>
.predict()
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test)) model.save("test_model.h5")
結論
本教程提供了對使用Keras和CNN構建手寫數字識別模型的基本理解。 儘管實現高精度(例如,> 99%),但通過模型參數調整,數據增強和探索更高級的CNN體系結構進行了進一步的改進。 提供的常見問題解答提供了對所涉及概念的進一步見解。
以上是KERAS的初學者指南:30分鐘內數字識別的詳細內容。更多資訊請關注PHP中文網其他相關文章!