Pytesseract OCR マルチ構成構成
光学式文字認識 (OCR) に Pytesseract を利用する場合、その設定を最適化して機能を向上させることが重要です。特定のシナリオの精度。この記事では、OCR が 1 桁の数字と文字 'O' を区別するのが難しいという特定の問題について説明します。
問題:
Pytesseract は数字を区別できない1 桁の場合は「-psm 7」で構成されている場合、ゼロと文字「O」
解決策:
この課題に対処するために、Tesseract 4.0.0a は 2 つの主要な構成オプションを提供します:
サンプル コード:
次のコードは、使用方法を示しています。これらの構成オプションを組み合わせる:
import pytesseract from PIL import Image # Load the image im = Image.open('digits_image.png') # Multiple configuration options target = pytesseract.image_to_string(im, config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
この構成では、 Pytesseract は、1 桁の数字を「O」と間違える可能性を排除しながら、正確に認識できます。
以上が1 桁認識で \'0\' と \'O\' を区別できるように Pytesseract を構成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。