畳み込みニューラルネットワークを使用した手書き数字認識

PHPz
リリース: 2024-01-23 21:03:22
転載
1084 人が閲覧しました

畳み込みニューラルネットワークを使用した手書き数字認識

MNIST データ セットは手書きの数字で構成されており、60,000 のトレーニング サンプルと 10,000 のテスト サンプルが含まれています。各サンプルは、0 から 9 までの数値を表す 28x28 ピクセルのグレースケール画像です。

畳み込みニューラル ネットワーク (CNN) は、深層学習における画像分類に使用されるモデルです。畳み込み層とプーリング層を通じて画像の特徴を抽出し、分類には全結合層を使用します。

以下では、Python と TensorFlow を使用して、MNIST データ セットを分類するための単純な CNN モデルを実装する方法を紹介します。

まず、必要なライブラリと MNIST データセットをインポートする必要があります:

import tensorflow as tf
from tensorflow.keras.datasets import mnist

# 加载MNIST数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
ログイン後にコピー

次に、画像データを正規化し、ラベル データを独自のホット エンコーディングに変換する必要があります。形式:

# 归一化图像数据
x_train = x_train / 255.0
x_test = x_test / 255.0

# 将标签数据转换为独热编码格式
y_train = tf.keras.utils.to_categorical(y_train, num_classes=10)
y_test = tf.keras.utils.to_categorical(y_test, num_classes=10)
ログイン後にコピー

次に、CNN モデルを定義します。このモデルには、2 つの畳み込み層と 2 つのプーリング層、および完全接続層が含まれています。分類には最後の層で ReLU 活性化関数と Softmax 活性化関数を使用します。コードは次のとおりです:

model = tf.keras.models.Sequential([
    # 第一个卷积层
    tf.keras.layers.Conv2D(filters=32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    # 第二个卷积层
    tf.keras.layers.Conv2D(filters=64, kernel_size=(3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    # 将特征图展平
    tf.keras.layers.Flatten(),
    # 全连接层
    tf.keras.layers.Dense(units=128, activation='relu'),
    # 输出层
    tf.keras.layers.Dense(units=10, activation='softmax')
])
ログイン後にコピー

次に、モデルをコンパイルし、損失関数、オプティマイザー、および評価メトリクスを指定する必要があります:

# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
ログイン後にコピー

最後に、モデルをトレーニングしてテストします:

# 训练模型
model.fit(x_train.reshape(-1, 28, 28, 1), y_train, epochs=5, batch_size=32)

# 测试模型
score = model.evaluate(x_test.reshape(-1, 28, 28, 1), y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
ログイン後にコピー

完全なコードを実行した後、モデルのテスト精度が約 99% であることがわかります。

要約すると、畳み込みニューラル ネットワークを使用して MNIST データセットを分類する手順は次のとおりです:

1. MNIST データセットをロードします。正規化とワンホット エンコーディングを含む前処理に進みます;

2. 畳み込み層、プーリング層、全結合層を含む CNN モデルを定義し、活性化関数を指定します;

3. モデルをコンパイルし、損失関数、オプティマイザー、評価指標を指定します;

4. モデルをトレーニングし、テスト セットでテストします。

上記は、特定の状況に応じて変更および最適化できる簡単な例です。

以上が畳み込みニューラルネットワークを使用した手書き数字認識の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:163.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート