首页 > 后端开发 > Python教程 > 如何配置 Pytesseract 仅进行单位数字识别?

如何配置 Pytesseract 仅进行单位数字识别?

Mary-Kate Olsen
发布: 2024-12-27 12:30:10
原创
143 人浏览过

How to Configure Pytesseract for Single-Digit Number Recognition Only?

Pytesseract OCR:配置单位数和仅数字识别

Pytesseract 是一个开源 OCR 库,提供配置方面的灵活性其发动机满足特定要求。在这种情况下,我们的目标是将 Tesseract 配置为识别单个数字,同时将其限制为数字,因为数字“0”经常会被误解为字母“O”。

问题定义

用户在使用以下方法为此目的配置 Pytesseract 时遇到困难语法:

target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits')
登录后复制

配置参数

如 tesseract-4.0.0a 中所述,Tesseract 支持各种页面分段模式,每种模式都有特定的特征。为了启用单字符识别,我们将 psm 设置为 10。此外,为了限制对数字的识别,我们将 tessedit_char_whitelist 设置为仅包含所需的数字范围 (0-9)。

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \
        config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
登录后复制

以上是如何配置 Pytesseract 仅进行单位数字识别?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板