Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich Pytesseract so konfigurieren, dass es bei der Einzelziffernerkennung zwischen „0' und „O' unterscheidet?

Wie kann ich Pytesseract so konfigurieren, dass es bei der Einzelziffernerkennung zwischen „0' und „O' unterscheidet?

Linda Hamilton
Freigeben: 2024-11-26 06:20:09
Original
793 Leute haben es durchsucht

How Can I Configure Pytesseract to Distinguish Between

Pytesseract OCR-Multikonfigurationskonfiguration

Bei der Verwendung von Pytesseract für die optische Zeichenerkennung (OCR) ist es wichtig, die Einstellungen zu optimieren, um sie zu verbessern Genauigkeit für bestimmte Szenarien. Dieser Artikel befasst sich mit einem besonderen Problem, bei dem die OCR Schwierigkeiten hat, zwischen einstelligen Zahlen und dem Buchstaben „O“ zu unterscheiden.

Problem:

Pytesseract kann nicht zwischen der Zahl unterscheiden Null und der Buchstabe „O“, wenn mit „-psm 7“ für eine einzelne Ziffer konfiguriert Erkennung.

Lösung:

Um dieser Herausforderung zu begegnen, bietet Tesseract 4.0.0a zwei wichtige Konfigurationsoptionen:

  • psm (Seitensegmentierungsmodus): Gibt an, wie Tesseract ein Bild in Textbereiche unterteilen soll. Für die Einzelzeichenerkennung sollte psm auf 10 eingestellt werden.
  • tessedit_char_whitelist: Beschränkt Tesseract auf die Erkennung nur bestimmter Zeichen. In diesem Fall sollte die Whitelist nur auf Nummern beschränkt sein, z. B. „0123456789“.

Beispielcode:

Der folgende Code veranschaulicht die Verwendung diese Konfigurationsoptionen zusammen:

import pytesseract
from PIL import Image

# Load the image
im = Image.open('digits_image.png')

# Multiple configuration options
target = pytesseract.image_to_string(im, config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
Nach dem Login kopieren

Mit dieser Konfiguration kann Pytesseract genau erkennen einstellige Zahlen unter Ausschluss der Möglichkeit, sie mit „O“ zu verwechseln.

Das obige ist der detaillierte Inhalt vonWie kann ich Pytesseract so konfigurieren, dass es bei der Einzelziffernerkennung zwischen „0' und „O' unterscheidet?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage