Nach der Umwandlung des Bildes in einen anderen Raum konvergieren Bilder derselben Kategorie, während Bilder verschiedener Kategorien weit entfernt zusammenlaufen. Im ursprünglichen Pixelraum ist es schwierig, einfache Linien oder einfache Linien zu verwenden Durch die Aufteilung der Fläche und deren Umwandlung in einen anderen Raum können Sie diese sehr gut trennen.Die drei klassischen Algorithmen zur Gesichtserkennung sind: Eigenface, Local Binary Patterns (LBP) und Fisherface-Algorithmus. „Drei klassische Algorithmen zur Gesichtserkennung“ . Die Methode, Eigengesichter zur Gesichtserkennung zu verwenden, wurde erstmals von Sirovich und Kirby (1987) vorgeschlagen („Low-dimensional procedure for the Characterization of Human Faces“) und von Matthew Turk und Alex Pentland („Eigenfaces for Recognition“) zur Gesichtsklassifizierung verwendet. . Zunächst wird ein Stapel von Gesichtsbildern in einen Satz von Merkmalsvektoren, sogenannte „Eigenfaces“, umgewandelt, die die Grundkomponenten des anfänglichen Trainingsbildsatzes darstellen. Der Erkennungsprozess besteht darin, ein neues Bild in den Eigenflächen-Unterraum zu projizieren und es anhand der Position seines Projektionspunkts im Unterraum und der Länge der Projektionslinie zu bestimmen und zu identifizieren.
Die von Eigenfaces ausgewählte räumliche Transformationsmethode ist PCA (Hauptkomponentenanalyse), um die Hauptkomponenten der Gesichtsverteilung zu erhalten. Die spezifische Implementierung besteht darin, eine Eigenwertzerlegung der Kovarianzmatrix aller Gesichtsbilder im Trainingssatz durchzuführen Erhalten Sie die entsprechenden Eigenwerte. Diese Eigenvektoren sind „Eigenflächen“. Jeder Eigenvektor oder jedes Eigengesicht entspricht der Erfassung oder Beschreibung einer Veränderung oder Charakteristik zwischen menschlichen Gesichtern. Dies bedeutet, dass jedes Gesicht als lineare Kombination dieser Eigengesichter dargestellt werden kann. Lokale binäre Muster (LBP)
Lokale binäre Muster (LBP) sind visuelle Operatoren, die zur Klassifizierung im Bereich Computer Vision verwendet werden. LBP, ein Operator zur Beschreibung von Bildtexturmerkmalen, wurde 1996 von T. Ojala et al. an der Universität Oulu, Finnland, vorgeschlagen („Eine vergleichende Studie zu Texturmaßen mit Klassifizierung basierend auf Merkmalsverteilungen“). Im Jahr 2002 veröffentlichten T. Ojala et al. einen weiteren Artikel über LBP („Multiresolution grey-scale and rotation invariant Texture Classification with Local Binary Patterns“) auf PAMI. In diesem Artikel werden die verbesserten LBP-Funktionen von Mehrfachauflösung, Graustufeninvarianz, Rotationsinvarianz und äquivalenten Modi sehr deutlich erläutert. Die Kernidee von LBP besteht darin, den Grauwert des zentralen Pixels als Schwellenwert zu verwenden und ihn mit seinem Feld zu vergleichen, um den entsprechenden Binärcode zur Darstellung der lokalen Texturmerkmale zu erhalten.
LBP extrahiert lokale Merkmale als Grundlage für Diskriminierung. Der wesentliche Vorteil der LBP-Methode besteht darin, dass sie unempfindlich gegenüber Licht ist, die Probleme der Körperhaltung und des Ausdrucks jedoch nicht löst. Im Vergleich zur Eigenface-Methode wurde die Erkennungsrate von LBP jedoch erheblich verbessert.
Fisherface-Algorithmus
Die lineare Diskriminanzanalyse berücksichtigt Kategorieinformationen und reduziert gleichzeitig die Dimensionalität. Sie wurde 1936 vom Statistiker Sir R. A. Fisher erfunden („Die Verwendung mehrerer Messungen bei taxonomischen Problemen“). Um einen Weg zu finden, Merkmale zu kombinieren, um die maximale Streuung zwischen den Klassen und die minimale Streuung innerhalb der Klassen zu erreichen. Die Idee ist einfach: In einer niedrigdimensionalen Darstellung sollten dieselben Klassen eng beieinander gruppiert sein, während verschiedene Klassen so weit wie möglich voneinander entfernt sein sollten. 1997 wandte Belhumer das Fisher-Diskriminanzkriterium erfolgreich auf die Gesichtsklassifizierung an und schlug die Fisherface-Methode vor, die auf einer linearen Diskriminanzanalyse basiert („Eigenfaces vs. Fisherfaces: Erkennung mithilfe klassenspezifischer linearer Projektion“).
Weitere Informationen zu diesem Thema finden Sie unter:
Chinesische PHP-Website!
Das obige ist der detaillierte Inhalt vonWas sind die drei klassischen Algorithmen zur Gesichtserkennung?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!