Aktuelle Deep-Learning-basierte Methoden stehen vor einigen Herausforderungen hinsichtlich der Erkennungsgeschwindigkeit und der Modellkomplexität. Um die Genauigkeit und Geschwindigkeit der Erkennung von Gebäudeaußenwandfehlern sicherzustellen, haben wir eine verbesserte YOLOv7-Methode namens BFD-YOLO untersucht. Zunächst wird das ursprüngliche ELAN-Modul in YOLOv7 durch das leichte MobileOne-Modul ersetzt, um die Anzahl der Parameter zu reduzieren und die Inferenzgeschwindigkeit zu erhöhen. Zweitens wird dem Modell ein Koordinatenaufmerksamkeitsmodul hinzugefügt, um die Funktionen zur Merkmalsextraktion zu verbessern. Als nächstes wird SCYLLA-IoU verwendet, um die Erkennung zu beschleunigen und den Rückruf des Modells zu erhöhen. Schließlich haben wir den offenen Datensatz erweitert und einen Datensatz zu Gebäudefassadenschäden erstellt, der drei typische Mängel umfasst. BFD-YOLO zeigt basierend auf diesem Datensatz eine hervorragende Genauigkeit und Effizienz. Im Vergleich zu YOLOv7 sind die Genauigkeit und mAP@0,5 von BFD-YOLO um 2,2 % bzw. 2,9 % verbessert, während eine beträchtliche Effizienz erhalten bleibt. Experimente zeigen, dass diese Methode eine hohe Erkennungsgenauigkeit erreicht und gleichzeitig eine Echtzeitleistung gewährleistet.
Das Vorhandensein von Fassadenmängeln ist ein drängendes Problem während der Betriebsphase des Baus und wird häufig auf mechanische und umweltbedingte Faktoren zurückgeführt. Typische Mängel sind Betonabplatzungen, Zierabplatzungen, Bauteilrisse, großflächige Verformungen, Fliesenschäden, Feuchtigkeitsschäden etc. Diese Mängel können das Erscheinungsbild beeinträchtigen und die Lebensdauer des Gebäudes verkürzen. Als integraler Bestandteil der Erkennung struktureller Schäden kann die Erkennung von Mängeln an Gebäudeaußenwänden Regierungen und Management in die Lage versetzen, den Gesamtzustand von Gebäudeaußenwänden genau zu verstehen und so bei der Formulierung angemessener Reparaturpläne zu helfen. Dies ist von entscheidender Bedeutung, um die Kosten für die Gebäudeinstandhaltung zu senken und die Lebensdauer des Gebäudes zu verlängern. Als integraler Bestandteil der Erkennung struktureller Schäden kann die Erkennung von Mängeln an Gebäudeaußenwänden Regierungen und Management in die Lage versetzen, den Gesamtzustand von Gebäudeaußenwänden genau zu verstehen und so bei der Formulierung angemessener Reparaturpläne zu helfen. Dies ist von entscheidender Bedeutung, um die Kosten für die Gebäudeinstandhaltung zu senken und die Lebensdauer des Gebäudes zu verlängern. Viele Länder und Regionen entwickeln Richtlinien für regelmäßige standardisierte Sichtprüfungen. Die Erkennung von Mängeln an Gebäudeaußenwänden ist zu einem wichtigen Bestandteil der Gebäudeinstandhaltung geworden. Sie trägt dazu bei, den Gesamtzustand von Gebäudeaußenwänden genau zu verstehen und so bei der Formulierung angemessener Reparaturpläne zu helfen. Dies ist eine wichtige Möglichkeit, die Instandhaltungskosten des Gebäudes zu senken und die Lebensdauer des Gebäudes zu verlängern. Viele Länder und Regionen entwickeln Richtlinien für regelmäßige standardisierte Sichtprüfungen. Die Erkennung von Mängeln an Gebäudeaußenwänden ist zu einem wichtigen Bestandteil der Gebäudeinstandhaltung geworden. Sie trägt dazu bei, den Gesamtzustand von Gebäudeaußenwänden genau zu verstehen und so bei der Formulierung angemessener Reparaturpläne zu helfen. Dies ist eine wichtige Möglichkeit, die Kosten für die Gebäudeinstandhaltung zu senken und die Lebensdauer des Gebäudes zu verlängern. Die Erkennung von Mängeln an Außenwänden von Gebäuden ist zu einem wichtigen Bestandteil der Gebäudeinstandhaltung geworden. Sie trägt dazu bei, den Gesamtzustand der Außenwände von Gebäuden genau zu verstehen und so bei der Formulierung angemessener Reparaturpläne zu helfen. Dies ist eine wichtige Möglichkeit, die Kosten für die Gebäudeinstandhaltung zu senken und die Lebensdauer des Gebäudes zu verlängern.
Die visuelle Inspektion ist eine einfache und zuverlässige Möglichkeit, den Zustand der Außenseite eines Gebäudes zu beurteilen. Bei herkömmlichen Außeninspektionen von Gebäuden müssen in der Regel Fachleute mit Spezialwerkzeugen am Inspektionsort eintreffen, wo sie mithilfe von Sichtprüfung, Hämmern und anderen Techniken bewertet werden. Diese Methoden beruhen auf dem Fachwissen und der Erfahrung des Prüfers, was subjektiv, gefährlich und ineffizient ist. Aufgrund der zunehmenden Anzahl und Größe von Gebäuden reichen manuelle visuelle Inspektionsmethoden nicht mehr aus, um die Anforderungen für groß angelegte Inspektionen zu erfüllen. Mit fortschreitender Technologie werden viele neue Methoden (wie Laserscanning, 3D-Wärmebildgebung und SLAM) zur Erkennung von Schäden an Außenwänden mithilfe von Drohnen und Roboterplattformen eingesetzt. Diese neuen Methoden sind bequemer und sicherer als herkömmliche Techniken, aber zeitaufwändig und kostspielig. Daher stehen diese Methoden auch vor Herausforderungen, wenn es darum geht, die Anforderungen groß angelegter Inspektionen zu erfüllen. Daher ist es notwendig, eine genauere und effektivere Methode zur Erkennung von Oberflächendefekten zu entwickeln, um die Erkennungseffizienz zu verbessern und die Rechenkosten zu senken.
Es gibt viele Arten von Mängeln an Gebäudeaußenwänden und es sind unterschiedliche Erkennungsmethoden anwendbar. Zu den häufigsten Formen gehören Ausreißfehler, Abplatzungen und Wandlöcher. Für Risse gibt es weitere Studien, die semantische Segmentierung zur Erkennung nutzen. Bei Wandhohlräumen werden häufiger das Gewindebohrverfahren und das Infrarot-Wärmebildverfahren eingesetzt. Nach Recherche und Recherche haben wir Fehlertypen ausgewählt, die für Zielerkennungsmethoden geeignet sind und einfach zu erstellende Datensätze sind. Die Bilder im Datensatz stammen hauptsächlich aus Bildern von Gebäudefassaden, die mit Mobiltelefonen, Kameras und Drohnen aufgenommen wurden. Darüber hinaus werden auch einige Bilder aus dem Internet und öffentlichen Datensätzen zur Erweiterung genutzt. Alle Bilder haben eine Breite von 1000 Pixel bis 3000 Pixel. Der Höhenbereich liegt zwischen 2000 Pixel und 5000 Pixel. Der Datensatz besteht aus drei Mängeln an Gebäudefassaden: Delaminierung, Abplatzungen und Fliesenverlust. Insgesamt wurden 1907 Originalbilder gesammelt, die Hintergrundbilder von Infrarot-Wärmebildern enthielten. Hintergrundbilder sind fehlerfreie Bilder, die dem Datensatz hinzugefügt werden, um Fehlerstellen zu reduzieren. Der Trainingssatz, der Validierungssatz und der Testsatz werden im Verhältnis 7:2:1 aufgeteilt. Das Bild unten zeigt ein Beispiel für Fehler im Datensatz.
Von links nach rechts sind Delaminierung, Abplatzungen und Fliesenverlust zu beobachten.
Datenerweiterung
Beim Modelltraining neuronaler Netze sind häufig große Datenmengen erforderlich. Es ist jedoch relativ schwierig, Bilder von Mängeln an Gebäudefassaden zu erhalten, und bei den gesammelten Daten besteht ein Klassenungleichgewichtsproblem. Um die Auswirkungen dieses Problems abzumildern, wenden wir Techniken zur Datenerweiterung auf die Trainingsdaten an. Datenerweiterung ist eine gängige Technik zur Durchführung verschiedener Transformationen an Rohdaten. Es wird häufig im Bereich Deep Learning verwendet, um mehr Trainingsdaten zu generieren. Durch die Datenerweiterung kann das Modell mehr Datenvariationen erlernen und verhindern, dass es übermäßig von bestimmten Trainingsbeispielen abhängig ist. Zu den Techniken zur Verbesserung von Überwachungsdaten gehören geometrische Transformationen (z. B. Spiegeln, Drehen, Skalieren, Zuschneiden usw.) und Pixeltransformationen (z. B. Rauschen, Unschärfe, Helligkeitsanpassung, Sättigungsanpassung usw.). Das Ziel der Datenerweiterung besteht darin, mehr Trainingsbeispiele zu generieren und gleichzeitig eine übermäßige Abhängigkeit von einem bestimmten Trainingsbeispiel zu verhindern. Dies kann dazu beitragen, dass das Modell besser auf Datenänderungen reagiert und eine Überanpassung verhindert. Durch die Datenerweiterung kann das Modell mehr Datenvariationen erlernen und verhindern, dass es übermäßig von bestimmten Trainingsbeispielen abhängig ist. Für Techniken zur Verbesserung von Überwachungsdaten können verschiedene Transformationen (z. B. Spiegeln, Drehen, Skalieren, Zuschneiden usw.) und Pixeltransformationen (z. B. Rauschen, Unschärfe, Helligkeitsanpassung, Sättigungsanpassung usw.) angewendet werden. Diese Techniken können dazu beitragen, dass das Modell besser auf Datenänderungen reagiert und eine Überanpassung verhindert. Um die Datenerweiterungstechniken voll auszunutzen, können wir verschiedene Datentransformationen (wie Spiegeln, Drehen, Skalieren, Zuschneiden usw.) und Pixeltransformationen (wie Rauschen, Unschärfe, Helligkeitsanpassung, Sättigungsanpassung) verwenden
Neues Design Das FrameworkDie Funktion des Backbone-Netzwerks besteht darin, Funktionen zu extrahieren. Das ursprüngliche Backbone von YOLOv7 besteht aus mehreren CBS, MP und ELAN Module, die aus Normalisierungs- und SiLU-Aktivierungsfunktionen bestehen, ersetzen das ELAN-Modul durch ein MobileOne-Modul, und hinter jedem MobileOne-Modul wird ein koordiniertes Aufmerksamkeitsmodul hinzugefügt Eingabebild und Unterdrückung externer Informationen, wodurch die Erkennungsgenauigkeit effektiv verbessert wird. Der Kopf des Netzwerks besteht aus einem SPPPCC, mehreren ELAN2-, CatConv- und drei RepVGG-Blöcken Im Vergleich zur Datenpfad-Designstrategie konzentriert sich die Gradientenpfad-Designstrategie auf die Analyse der Quelle und Zusammensetzung von Gradienten, um eine Netzwerkarchitektur zu entwerfen, die Netzwerkparameter effektiv nutzt. Der Unterschied zwischen ELAN und ELAN2 ist die Struktur Neuparametrisierungsmethode, die auf RepVGG-Blöcke angewendet wird, um die Trainingsleistung und Inferenzgeschwindigkeit zu verbessern. Nach der Ausgabe von drei Feature-Maps generiert der Kopf drei Vorhersageergebnisse unterschiedlicher Größe über drei RepConv-Module Führen Sie Experimente durch. Die Hardware- und Softwarekonfiguration der Plattform ist in der folgenden Tabelle aufgeführt.
Win 10
CPU
I7-11700
Das obige ist der detaillierte Inhalt vonSmart Building: Erkennung von Defekten an Außenwänden von Gebäuden basierend auf YOLOv7. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!