Pytesseract OCR mit Erkennung einzelner Ziffern und Einschränkungen nur auf Zahlen
Im Kontext von Pytesseract die Konfiguration von Tesseract, um einzelne Ziffern zu erkennen und die Ausgabe einzuschränken Zahlen zu verstehen, kann eine Herausforderung sein. Um dieses Problem anzugehen, befassen wir uns mit den Besonderheiten der Konfigurationsoptionen von Tesseract.
Tesseract-Seitensegmentierungsmodi
Tesseract bietet verschiedene Seitensegmentierungsmodi (PSM) zur Verarbeitung verschiedener Texte Layouts. Für die Erkennung einzelner Zeichen beträgt der geeignete PSM-Wert 10. Dieser Modus behandelt das Bild als einzelnes Zeichen.
Whitelist für Zeichen
Um die erkannten Zeichen auf Zahlen zu beschränken, haben wir kann den Konfigurationsparameter tessedit_char_whitelist nutzen. Durch die Angabe von 0123456789 als Whitelist akzeptiert Tesseract nur diese Zeichen.
Beispielverwendung
Hier ist ein Beispiel für die Verwendung von image_to_string mit mehreren Konfigurationsoptionen:
target = pytesseract.image_to_string(image, lang='eng', boxes=False, config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
Indem Sie psm auf 10 setzen und die Zeichen-Whitelist verwenden, wird dies erreicht Die Konfiguration stellt sicher, dass Tesseract einzelne Ziffern erkennt, während die Ausgabe auf numerische Werte beschränkt wird. Darüber hinaus gibt „lang“ die Sprache an, „boxes“ deaktiviert die Grenzen von Textfeldern und „oem“ wählt die OCR-Engine aus.
Das obige ist der detaillierte Inhalt vonWie kann ich Pytesseract für die Erkennung einzelner Ziffern mit reiner Zahlenausgabe konfigurieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!