ホームページ > バックエンド開発 > Python チュートリアル > Pytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?

Pytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-12-27 12:30:10
オリジナル
138 人が閲覧しました

How to Configure Pytesseract for Single-Digit Number Recognition Only?

Pytesseract OCR: 1 桁および数字のみの認識用の構成

オープンソース OCR ライブラリである Pytesseract は、構成における柔軟性を提供します。特定の要件に対応するエンジン。このコンテキストでは、数字 '0' が文字 'O' と誤って解釈されることが多いため、数字に制限しながら 1 桁の数字を認識するように Tesseract を構成することを目指しています。

問題定義

次のコマンドを使用してこの目的のために Pytesseract を構成すると、ユーザーは問題に遭遇します構文:

target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')
ログイン後にコピー

構成パラメータ

tesseract-4.0.0a で概要が説明されているように、Tesseract は、それぞれ固有の特性を持つさまざまなページ セグメンテーション モードをサポートしています。単一文字の認識を有効にするには、psm を 10 に設定します。さらに、認識を数字に制限するために、必要な範囲の数字 (0 ~ 9) のみを含むように tessedit_char_whitelist を設定します。

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
ログイン後にコピー

以上がPytesseract を 1 桁の数値認識のみに設定するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート