Beispiel für einen GAN-Algorithmus in Python

王林

Freigeben： 2023-06-10 09:53:50

Original

1356 Leute haben es durchsucht

Generative Adversarial Networks (GAN) ist ein Deep-Learning-Algorithmus, der durch zwei miteinander konkurrierende neuronale Netze neue Daten generiert. GAN wird häufig für Generierungsaufgaben in den Bereichen Bild, Audio, Text und anderen Bereichen verwendet. In diesem Artikel werden wir Python verwenden, um ein Beispiel für einen GAN-Algorithmus zum Generieren von Bildern handgeschriebener Ziffern zu schreiben.

Datensatzvorbereitung

Wir werden den MNIST-Datensatz als unseren Trainingsdatensatz verwenden. Der MNIST-Datensatz enthält 60.000 Trainingsbilder und 10.000 Testbilder, jedes Bild ist ein 28x28-Graustufenbild. Wir werden die TensorFlow-Bibliothek verwenden, um den Datensatz zu laden und zu verarbeiten. Bevor wir den Datensatz laden, müssen wir die TensorFlow-Bibliothek und die NumPy-Bibliothek installieren. Tensorflow als TF importieren shape[0], 28, 28, 1).astype('float32')

train_images = (train_images - 127.5) / 127.5 # Pixelwerte auf den Bereich von [-1, 1] normalisieren

GAN-Architekturdesign und Training

Unser GAN wird zwei neuronale Netze umfassen: ein Generatornetzwerk und ein Diskriminatornetzwerk. Das Generatornetzwerk empfängt den Rauschvektor als Eingabe und gibt ein 28x28-Bild aus. Das Diskriminatornetzwerk empfängt ein 28x28-Bild als Eingabe und gibt die Wahrscheinlichkeit aus, dass es sich bei dem Bild um ein echtes Bild handelt.

Die Architektur sowohl des Generatornetzwerks als auch des Diskriminatornetzwerks wird Faltungs-Neuronale Netzwerke (CNN) verwenden. Im Generatornetzwerk verwenden wir eine Entfaltungsschicht, um den Rauschvektor in ein 28x28-Bild zu dekodieren. Im Diskriminatornetzwerk verwenden wir Faltungsschichten, um die Eingabebilder zu klassifizieren.

Der Eingang zum Generatornetzwerk ist ein Rauschvektor der Länge 100. Wir werden die Netzwerkschichten mithilfe der Funktion tf.keras.Sequential stapeln.

def make_generator_model():

model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(7*7*256, use_bias=False, input_shape=(100,)))
model.add(tf.keras.layers.BatchNormalization())
model.add(tf.keras.layers.LeakyReLU())

model.add(tf.keras.layers.Reshape((7, 7, 256)))
assert model.output_shape == (None, 7, 7, 256) # 注意：batch size没有限制

model.add(tf.keras.layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False))
assert model.output_shape == (None, 7, 7, 128)
model.add(tf.keras.layers.BatchNormalization())
model.add(tf.keras.layers.LeakyReLU())

model.add(tf.keras.layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False))
assert model.output_shape == (None, 14, 14, 64)
model.add(tf.keras.layers.BatchNormalization())
model.add(tf.keras.layers.LeakyReLU())

model.add(tf.keras.layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh'))
assert model.output_shape == (None, 28, 28, 1)

return model

Nach dem Login kopieren

Die Eingabe des Diskriminatornetzwerks ist ein 28x28-Bild. Wir werden die Netzwerkschichten mithilfe der Funktion tf.keras.Sequential stapeln.

def make_discriminator_model():

model = tf.keras.Sequential()
model.add(tf.keras.layers.Conv2D(64, (5, 5), strides=(2, 2), padding='same',
                                 input_shape=[28, 28, 1]))
model.add(tf.keras.layers.LeakyReLU())
model.add(tf.keras.layers.Dropout(0.3))

model.add(tf.keras.layers.Conv2D(128, (5, 5), strides=(2, 2), padding='same'))
model.add(tf.keras.layers.LeakyReLU())
model.add(tf.keras.layers.Dropout(0.3))

model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(1))

return model

Nach dem Login kopieren

Als nächstes schreiben wir den Trainingscode. Wir werden in jeder Charge abwechselnd das Generatornetzwerk und das Diskriminatornetzwerk trainieren. Während des Trainingsprozesses zeichnen wir die Farbverläufe mit der Funktion tf.GradientTape() auf und optimieren dann das Netzwerk mit der Funktion tf.keras.optimizers.Adam().

generator = make_generator_model () real_output, fake_output):

real_loss = cross_entropy(tf.ones_like(real_output), real_output)
fake_loss = cross_entropy(tf.zeros_like(fake_output), fake_output)
total_loss = real_loss + fake_loss
return total_loss

Nach dem Login kopieren

Generatorverlustfunktion

def generator_loss(fake_output):

return cross_entropy(tf.ones_like(fake_output), fake_output)

Nach dem Login kopieren

optimizer

generator_optimizer = tf.keras.optimizers.Adam(1e-4)

discriminator_optimizer = tf.keras.optimizers.Adam(1e-4)

Definieren Sie Trainingsfunktionen , werden wir das Generatornetzwerk verwenden, um neue Bilder zu generieren. Wir werden zufällig 100 Rauschvektoren generieren und sie in das Generatornetzwerk einspeisen, um neue Bilder handgeschriebener Ziffern zu erzeugen.

matplotlib.pyplot als plt importieren

def generic_and_save_images(model, epoch, test_input):

noise = tf.random.normal([BATCH_SIZE, 100])

with tf.GradientTape() as gen_tape, tf.GradientTape() as disc_tape:
    generated_images = generator(noise, training=True)

    real_output = discriminator(images, training=True)
    fake_output = discriminator(generated_images, training=True)

    gen_loss = generator_loss(fake_output)
    disc_loss = discriminator_loss(real_output, fake_output)

gradients_of_generator = gen_tape.gradient(gen_loss, generator.trainable_variables)
gradients_of_discriminator = disc_tape.gradient(disc_loss, discriminator.trainable_variables)

generator_optimizer.apply_gradients(zip(gradients_of_generator, generator.trainable_variables))
discriminator_optimizer.apply_gradients(zip(gradients_of_discriminator, discriminator.trainable_variables))

Nach dem Login kopieren

Rauschenvektoren zufällig generieren

noise = tf.random.normal([16, 100])

generate_and_save_images(generator, 0 , Rauschen)

Die Ergebnisse zeigen, dass der Generator erfolgreich neue handgeschriebene Ziffernbilder generiert hat. Wir können die Leistung des Modells verbessern, indem wir die Anzahl der Trainingsepochen schrittweise erhöhen. Darüber hinaus können wir die Leistung von GAN weiter verbessern, indem wir andere Hyperparameterkombinationen und Netzwerkarchitekturen ausprobieren.

Kurz gesagt ist der GAN-Algorithmus ein sehr nützlicher Deep-Learning-Algorithmus, mit dem verschiedene Arten von Daten generiert werden können. In diesem Artikel haben wir ein Beispiel für einen GAN-Algorithmus zum Generieren von Bildern handgeschriebener Ziffern mit Python geschrieben und gezeigt, wie man ein Generatornetzwerk trainiert und verwendet, um neue Bilder zu generieren.

Das obige ist der detaillierte Inhalt vonBeispiel für einen GAN-Algorithmus in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!