限られたデータセットを使用した Keras トレーニング
Keras を使用してニューラル ネットワークをトレーニングしようとすると、利用可能なデータセットの一部しか利用していないことに気づきました。 60,000 個のサンプルにアクセスできるにもかかわらず、データセットは不十分です。公式 TensorFlow ガイドに従っているにもかかわらず、トレーニング プロセスに矛盾が見られます。この記事は、Keras がこのように動作する理由を説明し、解決策を提供することを目的としています。
部分的なデータセット使用の背後にある理由
モデル フィッティング中に発生した数字「1875」は、トレーニングサンプルの数を表すものではありません。むしろ、バッチの数を示します。デフォルトでは、Keras はトレーニング中にバッチ サイズ 32 を使用します。 60,000 サンプルのデータセットの場合、これは次と同等です。
60,000 / 32 = 1875
したがって、Keras はデータセットを 1875 のバッチに分割し、それぞれに 32 のサンプルが含まれます。その結果、各エポックは、データセット全体ではなく、これらの 1875 バッチを反復処理します。
解決策
データセット全体を利用するには、バッチ サイズを明示的に次のように設定できます。サンプルの総数:
<code class="python">model.fit(train_images, train_labels, epochs=10, batch_size=60000)</code>
これにより、Keras はデータセット全体でモデルをトレーニングし、パフォーマンスが向上する可能性があります。
以上が60,000 個のサンプルがあるにもかかわらず、Keras はデータセットの一部でしかトレーニングしないのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。