Dilatierte Faltung und erweiterte Faltung sind häufig verwendete Operationen in Faltungs-Neuronalen Netzen. In diesem Artikel werden ihre Unterschiede und Beziehungen im Detail vorgestellt.
Die erweiterte Faltung, auch als erweiterte Faltung oder erweiterte Faltung bekannt, ist eine Operation in einem Faltungs-Neuronalen Netzwerk. Es handelt sich um eine Erweiterung, die auf der herkömmlichen Faltungsoperation basiert und das Empfangsfeld des Faltungskerns durch Einfügen von Löchern in den Faltungskern erhöht. Auf diese Weise kann das Netzwerk ein breiteres Spektrum an Funktionen besser erfassen. Die erweiterte Faltung wird im Bereich der Bildverarbeitung häufig verwendet und kann die Leistung des Netzwerks verbessern, ohne die Anzahl der Parameter und den Rechenaufwand zu erhöhen. Durch die Erweiterung des Empfangsfelds des Faltungskerns kann die erweiterte Faltung die globalen Informationen im Bild besser verarbeiten und dadurch den Effekt der Merkmalsextraktion verbessern.
Die Hauptidee der erweiterten Faltung besteht darin, einige Intervalle um den Faltungskern herum einzuführen. Diese Intervalle ermöglichen es dem Faltungskern, sich auf der Eingabe-Feature-Map „springend“ zu bewegen, wodurch die Größe des Ausgabe-Features erhöht wird Karte, während die Größe des Faltungskerns unverändert bleibt. Insbesondere unter der Annahme, dass die Eingabe-Feature-Map X_{(i+mtimes r),(j+ntimes r)}K_{m,n}
ist, wobei r die Expansionsrate ist, die die Größe des Lochs in der angibt Faltungskern, m und n sind der Zeilen- und Spaltenindex. Durch Ändern der Größe der Expansionsrate r können Merkmalskarten verschiedener Empfangsfelder erhalten werden.
2. Atrous-Faltung
Die Hauptidee der erweiterten Faltung besteht darin, einige Löcher in den Faltungskern einzufügen. Diese Löcher können dazu führen, dass sich der Faltungskern auf der Eingabe-Feature-Map „springt“, wodurch die Größe der Ausgabe-Feature-Map erhöht wird Die Größe des Faltungskerns bleibt unverändert. Insbesondere unter der Annahme, dass die Eingabe-Feature-Map X_{(i+mtimes r),(j+ntimes r)}K_{m,n}
ist, wobei r die Lochrate ist, die die Größe des eingefügten Lochs angibt, m und n sind die Zeilen und Spalten im Faltungskernindex. Durch Ändern der Größe der Lochrate r können Merkmalskarten verschiedener Empfangsfelder erhalten werden.
3. Die Beziehung zwischen erweiterter Faltung und erweiterter Faltung. Die Konzepte der erweiterten Faltung und der erweiterten Faltung sind beide Erweiterungen, die auf traditionellen Faltungsoperationen basieren. Tatsächlich kann die erweiterte Faltung als eine Sonderform der erweiterten Faltung angesehen werden, da die Lochrate d bei der erweiterten Faltung tatsächlich die Lochrate r-1 bei der erweiterten Faltung ist. Daher kann die erweiterte Faltung als eine spezielle Art der erweiterten Faltung angesehen werden, die das Empfangsfeld des Faltungskerns durch Einfügen von Löchern erweitert und auch durch die Verwendung erweiterter Faltung implementiert werden kann.
Darüber hinaus können sowohl die erweiterte Faltung als auch die erweiterte Faltung für eine Vielzahl von Aufgaben in Faltungs-Neuronalen Netzen verwendet werden, wie z. B. Bildklassifizierung, semantische Segmentierung usw. Sie können die Leistung von Faltungs-Neuronalen Netzen bei verschiedenen Aufgaben verbessern. Da die Lochrate d bei der erweiterten Faltung jedoch diskret ist, ist ihr Empfangsfeld etwas ungenauer als das der erweiterten Faltung. Daher werden erweiterte Windungen möglicherweise häufiger bei Aufgaben verwendet, die erhöhte Empfangsfelder erfordern.
Das obige ist der detaillierte Inhalt vonVergleichen Sie die Ähnlichkeiten, Unterschiede und Beziehungen zwischen erweiterter Faltung und atröser Faltung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!