Der lang erwartete Erkennungsklassiker hat eine weitere Angriffswelle – YOLOv5. Unter diesen verfügt YOLOv5 nicht über vollständige Dateien. Das Wichtigste ist nun, YOLOv4 herauszufinden, was im Bereich der Zielerkennung große Vorteile bringt und in bestimmten Szenarien erheblich verbessert werden kann. Heute werden wir YOLOv4 für Sie analysieren. In der nächsten Ausgabe werden wir die Bereitstellung von YOLOv5 auf Apple-Handys üben oder es in Echtzeit über die Kamera am Terminal erkennen!
Es gibt eine große Anzahl von Funktionen, die die Genauigkeit von Convolutional Neural Networks (CNN) verbessern sollen. Kombinationen dieser Merkmale müssen an großen Datensätzen praktisch getestet und die Ergebnisse theoretisch validiert werden. Einige Funktionen funktionieren nur bei bestimmten Modellen, bei bestimmten Problemen oder bei kleinen Datensätzen, während andere Funktionen, wie etwa Batch-Normalisierung und Restverknüpfungen, bei den meisten Modellen, Aufgaben und Datensätzen funktionieren. In diesem Artikel wird davon ausgegangen, dass zu diesen gemeinsamen Merkmalen gewichtete Restverbindungen (WRC), stufenübergreifende Verbindungen (CSP), Cross-Minibatch-Normalisierung (CMbN), selbstgegnerisches Training (SAT) und Mish-Aktivierung gehören. Dieses Papier verwendet neue Funktionen: WRC, CSP, CMbN, SAT, Fehleraktivierung, Mosaikdatenerweiterung, CMbN, DropBlock-Regularisierung und CIoU-Verlust und kombiniert einige davon, um den folgenden Effekt zu erzielen: 43,5 % AP (65,7 % AP50), verwendet MS+COCO-Datensatz, Echtzeitgeschwindigkeit von 65 FPS auf dem Tesla V100. 2. Analyse innovativer Punkte Dies ist eine Verbesserung auf der Grundlage von CutMix, das zwei Bilder mischt Bild. Dann trainieren Sie auf diesem Bild. Diese Methode ist die Hauptmethode der Bildstilisierung und ermöglicht es dem Netzwerk, das Bild umgekehrt zu aktualisieren, um das Bild zu stilisieren.
Self-Adversarial Training (SAT) stellt ebenfalls eine neue Datenerweiterungstechnik dar, die in zwei Vorwärts-Rückwärts-Stufen arbeitet. In der 1. Stufe verändert das neuronale Netzwerk das Originalbild anstelle der Netzwerkgewichte ein gegnerischer Angriff auf sich selbst, der das Originalbild verändert, um die Täuschung zu erzeugen, dass es kein gewünschtes Objekt auf dem Bild gibt. In der 2. Stufe wird das neuronale Netzwerk darauf trainiert, ein Objekt auf diesem modifizierten Bild auf normale Weise zu erkennen.
Cross Mini-Batch Normal
CmBN stellt die modifizierte Version von CBN dar, wie in der Abbildung unten gezeigt, definiert als Cross Mini-Batch Normalization (CMBN). Dadurch werden nur Statistiken zwischen den kleinsten Chargen innerhalb einer einzelnen Charge erfasst. ?? concat.
Experiment
Nehmen wir als Beispiel die Datenverbesserungsmethode: Obwohl sie die Trainingszeit verlängert, kann sie die Leistung und Robustheit der Modellverallgemeinerung verbessern. Zum Beispiel die folgenden gängigen Verbesserungsmethoden:
Durch Experimente kann man sehen, dass es viele Tricks verwendet. Das stärkste Zielerkennungs-Kaleidoskop, die folgende Tabelle ist ein Experiment zum Klassifizierungsnetzwerk: CSPResNeXt-50-Klassifikatorgenauigkeit CSPDarknet-53-Klassifikatorgenauigkeit Im YOLOv4-Erkennungsnetzwerk vier Verluste (GIoU, CIoU, DIoU, MSE), Etikettenglättung, Kosinus-Lernen Rate, genetische Algorithmus-Hyperparameterauswahl, Mosaikdatenverbesserung und andere Methoden. Die folgende Tabelle enthält die Ergebnisse des Ablationsexperiments im YOLOv4-Erkennungsnetzwerk: CSPResNeXt50-PANet-SPP, 512x512 Verwendung verschiedener Trainingsgewichtsmodelle für das Training: Ergebnisse verschiedener Mini-Batch-Größen: Abschließend der Vergleich der Ergebnisse des COCO-Datensatzes für drei verschiedene GPU-Serien, Maxwell, Pascal und Volta: Die Das Aufregendste ist, dass im COCO-Datensatz ein Vergleich (Geschwindigkeit und Genauigkeit) mit anderen Frameworks möglich ist:
Das obige ist der detaillierte Inhalt vonDer gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!