为什么我的 Keras 模型在训练期间似乎只使用了 Fashion MNIST 数据集的一部分，即使它正在处理 1875 个批次？-Python教程-PHP中文网

为什么我的 Keras 模型在训练期间似乎只使用了 Fashion MNIST 数据集的一部分，即使它正在处理 1875 个批次？

Barbara Streisand

发布： 2024-11-04 09:06:02

原创

955 人浏览过

Why does my Keras model seem to only use part of my Fashion MNIST dataset during training, even though it's processing 1875 batches?

Keras 训练限制：解决部分数据集使用

使用 Keras 训练神经网络模型时，确保整个数据集是至关重要的训练期间使用。然而，在某些情况下，用户可能会遇到仅使用一小部分数据的问题。本文探讨了一个特定案例，其中在 Fashion MNIST 数据集上训练的模型仅使用部分可用数据，提供了全面的解释和解决方案。

提供的代码片段利用 model.fit() 方法默认参数，其中批量大小为 32。这意味着在每次迭代或 epoch 期间，模型都会处理训练数据集中的 32 个样本。对于包含 60,000 个样本的 Fashion MNIST 数据集，模型需要多次迭代整个数据集才能完成训练。然而，控制台中显示的输出表明模型在 1875 次迭代中完成了一个 epoch。

出现这种差异是因为 model.fit() 方法报告的是训练期间处理的批次数，而不是总数样品。因此，在本例中，模型对 1875 个批次进行训练，每个批次包含 32 个样本，总共有 1875 * 32 = 60,000 个样本。这意味着该模型确实在利用整个数据集进行训练，尽管在每个时期显示“1875/1875”的误导性进度条。

为了避免混淆并准确跟踪训练过程的进度，它建议计算并显示每个时期处理的样本数。这可以通过修改打印进度的代码来实现，如下所示：

<code class="python">for epoch in range(10):
    print(f"Current Epoch: {epoch + 1}")
    for batch_idx in range(1875):
        model.train_step((train_images[batch_idx * 32 : (batch_idx + 1) * 32],
                          train_labels[batch_idx * 32 : (batch_idx + 1) * 32]))
        print(f"Batch {batch_idx + 1} processed.")</code>

登录后复制

使用这种方法，控制台将同时显示批次和样本的进度，让您清楚地了解训练过程并确认模型正在按预期利用整个数据集。

以上是为什么我的 Keras 模型在训练期间似乎只使用了 Fashion MNIST 数据集的一部分，即使它正在处理 1875 个批次？的详细内容。更多信息请关注PHP中文网其他相关文章！