Hallo zusammen.
Haben Sie jemals darüber nachgedacht, mithilfe von KI-Technologie Mosaike zu entfernen?
Es ist ziemlich schwierig, sorgfältig über dieses Problem nachzudenken, da die KI-Technologie, die wir zuvor verwendet haben, sei es Gesichtserkennung oder OCR-Erkennung, zumindest manuell erkannt werden kann. Aber wenn man ein Mosaikbild bekommt, kann man es restaurieren?
ist offensichtlich schwierig. Wenn Menschen sich nicht erholen können, wie können wir dann Computern beibringen, sich zu erholen?
Erinnern Sie sich noch an den Artikel „Using AI to Generate Avatars“, den ich vor ein paar Tagen geschrieben habe? In diesem Artikel haben wir ein DCGAN-Modell trainiert, das aus beliebigen Zufallszahlen ein Bild generieren kann.
Lärmkarte generiert mit Zufallszahlen als Pixel
Modell von Der normale Avatar
DCGAN besteht aus zwei Modellen: einem Generatormodell und einem Diskriminatormodell. Die Funktion des Generatormodells besteht darin, ein Bild aus einer Reihe von Zufallszahlen zu generieren Je näher, desto besser, um das Diskriminatormodell zu täuschen. Das Diskriminatormodell muss seine Unterscheidungsfähigkeit kontinuierlich verbessern, um zu verhindern, dass die vom Generatormodell generierten Bilder weitergeleitet werden.
Wenn wir die Eingabe des obigen Generatormodells von Zufallszahlen auf Bilder mit Mosaiken ändern, sind die Ausgabe Bilder ohne Mosaike. Ist es möglich, ein Modell zu trainieren, das Mosaik entfernt?
Als nächstes werde ich mit Ihnen teilen, wie Sie das Mosaikentfernungsmodell trainieren, und dann ein fertiges Tool teilen, das Sie herunterladen und direkt verwenden können, um den Effekt auszuprobieren.
Hier verwenden wir nicht das oben eingeführte DCGAN, sondern zwei leistungsfähigere Modelle, Pix2pix und CycleGAN, um separat zu trainieren.
Pix2pix ist ein auf GAN basierender Bildübersetzungsalgorithmus. Von Mosaikbildern zu normalen Bildern ähnelt er im Wesentlichen der Konvertierung von einer Sprache in eine andere.
Pix2pix-Modellübersetzung
Der Effekt der CycleGAN-Implementierung besteht einfach darin, Bilder zwischen verschiedenen Domänen zu vergleichen. Transformiert, während die Form selbst bleibt unverändert.
CycleGAN-Modell
Der Artikel stellt uns den Datensatz und den vollständigen Trainingsprozess zur Verfügung, der uns bei niedrigeren helfen kann Kostenschulungsmodell.
Laden Sie zunächst den Datensatz herunter
Der Datensatz
ist insgesamt 654 Millionen.
Dann laden Sie das vorab trainierte Paddle-Modell herunter
Vorab trainiertes Modell
Schließlich trainieren Sie die Modelle Pix2pix und CycleGAN. 🎜🎜 /infer.py-Datei, um die Mosaikentfernungseffekte dieser beiden Modelle zu vergleichen.
2. Fertige Werkzeuge
Wenn Sie das Modell nicht selbst trainieren möchten, finden Sie hier ein fertiges Projekt dazu Teilen Sie es mit Ihnen, das ebenfalls auf semantischer Segmentierung und Bildübersetzung unter Bezugnahme auf Pix2pix und CycleGAN basiert. Projektadresse: https://github.com/HypoX64/DeepMosaics/blob/master/README_CN.md
Für Windows-Benutzer stellt der Autor eine kostenlose Software zur Verfügung, die Folgendes enthält eine GUI-Schnittstelle. Installieren Sie das Paket.
UI-SchnittstelleWir sagten zuvor, dass diese Technologie noch relativ schwierig ist, also haben Sie keine zu hohen Erwartungen. Hier ist der tatsächliche Entfernungseffekt.Kodierung
Dekodierung
Der Effekt ist immer noch in Ordnung, aber er ist nicht so perfekt wie gedacht. Sie können ihn herunterladen und ausführen, um ihn auszuprobieren.
Das obige ist der detaillierte Inhalt vonKann KI Mosaike entfernen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!