Latihan Keras dengan Set Data Terhad
Dalam cuba melatih rangkaian saraf dengan Keras, anda mendapati ia hanya menggunakan sebahagian daripada yang tersedia set data, walaupun mempunyai akses kepada 60,000 sampel. Semasa anda mengikuti panduan TensorFlow rasmi, proses latihan menunjukkan percanggahan. Artikel ini bertujuan untuk menerangkan sebab Keras berkelakuan dengan cara ini dan menyediakan penyelesaian.
Sebab Disebalik Penggunaan Separa Set Data
Nombor "1875" yang ditemui semasa pemasangan model tidak tidak mewakili bilangan sampel latihan; sebaliknya, ia menunjukkan bilangan kelompok. Secara lalai, Keras menggunakan saiz kelompok 32 semasa latihan. Untuk set data dengan 60,000 sampel, ini bersamaan dengan:
60,000 / 32 = 1875
Oleh itu, Keras membahagikan set data anda kepada 1875 kelompok, setiap satu mengandungi 32 sampel. Akibatnya, setiap zaman berulang pada 1875 kelompok ini dan bukannya keseluruhan set data.
Penyelesaian
Untuk menggunakan keseluruhan set data, anda boleh menetapkan saiz kelompok secara eksplisit kepada jumlah bilangan sampel:
<code class="python">model.fit(train_images, train_labels, epochs=10, batch_size=60000)</code>
Dengan berbuat demikian, Keras akan melatih model pada keseluruhan set data anda, yang mungkin menghasilkan prestasi yang lebih baik.
Atas ialah kandungan terperinci Mengapakah Keras hanya melatih sebahagian daripada set data saya, walaupun saya mempunyai 60,000 sampel?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!