Python EasyOCRライブラリの使用方法
説明
1. EasyOCR は、Python で書かれた OCR サードパーティ ライブラリです。 Python で呼び出して、画像内のテキストを識別し、テキストとして出力できます。
2. 80 を超える言語の認識をサポートし、PaddleOCR を超える高い認識精度を実現します。
インストール コマンド
pip install easyocr
コードの実装
import easyocr #设置识别中英文两种语言 reader = easyocr.Reader(["ch_sim","en"], gpu = False) # need to run only once to load model into memory result = reader.readtext(r"d:Desktop4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png", detail = 0) print(result)
拡張例:
画像とテキスト抽出のコード
from pathlib import Path import easyocr file_url = r"识别图片.jpg" # 需识别的图片 split_symbol = " " # 默认空格为分隔符 row_space = 15 # 默认字符高度为15px,当识别出来的字符间距超过这个数值时会换行。 def make_reader(): # 将模型加载到内存中。模型文件地址 C:Users用户.EasyOCRmodel reader = easyocr.Reader(["ch_sim", "en"]) return reader def change_to_character(file_url, reader, split_symbol=" ", row_space=15, save_dir="."): with open(file_url, "rb") as img: img_b = img.read() result = reader.readtext(img_b) result.sort(key=lambda x: x[0][0][1]) # 按竖直方向,进行排序==>进行分行处理。 # for i in result: # print(i) # print("="*100) # 按行进行分组 content = [] item = [result[0]] # 首先放入第一个元素 for i in result[1:]: if row_space >= i[0][0][1] - item[-1][0][0][1] >= 0: item.append(i) else: content.append(item) item = [i] content.append(item) filemane = Path(file_url).name.split(".")[0] with open(f"{save_dir}/{filemane}.txt", "w", encoding="utf8") as t: for i in content: # i 为每一行的内容 i.sort(key=lambda x: x[0][0][0]) # 对每行的内容进行先后排序 for r in i: # print(r) t.write(r[1] + split_symbol) t.write(" ") return content if __name__ == "__main__": change_to_character(file_url, make_reader())
UI インターフェイス コード
import tkinter as tk from tkinter import filedialog from PIL import Image, ImageTk from pathlib import Path from character import change_to_character, make_reader from threading import Thread import time # class Showing(tk.Frame): # def __init__(self, master=None): # super().__init__(master) # self.master = master # self.pack() # # self.img = tk.PhotoImage(file=r"C:UsersyanhyDesktop捕获22.PNG") # self.create_widgets() # # def create_widgets(self): # self.img = tk.PhotoImage(file=r"C:UsersyanhyDesktop捕获22.PNG") # self.img_wig = tk.Label(self, image=self.img) # self.img_wig.pack() # 最外层窗口设置 root = tk.Tk() root.title("图片文字识别程序 联系:410889472@qq.com") window_x = root.winfo_screenwidth() window_y = root.winfo_screenheight() WIDTH = 1200 HEIGHT = 750 x = (window_x - WIDTH) / 2 # 水平居中 y = (window_y - HEIGHT) / 3 # 垂直偏上 root.geometry(f"{WIDTH}x{HEIGHT}+{int(x)}+{int(y)}") root.resizable(width=False, height=False) # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 Row_space = 15 File_url_list = [] Img_type = [".jpg", ".jpeg", ".png", ".gif"] Split_symbol = " " # 间隔符。 Save_dir = Path.cwd().joinpath("img_to_word") if Save_dir.is_dir(): pass else: Path.mkdir(Save_dir) # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 def test(): print(f"{Row_space=}") def choose_file(): # 获取导入的图片路径地址 global show_img, img_label, text, File_url_list filenames = filedialog.askopenfilenames() if len(filenames) == 1 and len(File_url_list) == 0: # 单张图片导入,显示图片 if Path(filenames[0]).suffix.lower() in Img_type: # 判断是否图片类型 File_url_list = list(filenames) try: if text.winfo_exists(): text.destroy() except NameError as e: print(f"choose_file提示:张图片导入错误>>> {e}") try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f"choose_file提示:单张图片导入错误>>> {e}") img = Image.open(File_url_list[0]).resize((560, 660)) # print(img.size) show_img = ImageTk.PhotoImage(image=img) img_label = tk.Label(f_left, image=show_img) img_label.pack() else: print("导入的是非图像格式") else: # 多张图片导入,显示列表。 try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f"提示:多张图片导入错误>>> {e}") try: if text.winfo_exists(): text.destroy() except NameError as e: print(f"提示:多张图片导入错误>>> {e}") text = tk.Text(f_left, spacing1=5, spacing3=5) text.pack(fill="both", expand=True) for i in filenames: if Path(i).suffix.lower() in Img_type: File_url_list.append(i) else: pass File_url_list = set(File_url_list) for i in list(File_url_list): # 把文件写入到文本框中 text.insert("end", str(list(File_url_list).index(i)+1) + ": " + i + " ") File_url_list = list(File_url_list) print(f"{File_url_list=}") def choose_dir(): global show_img, img_label, text, File_url_list directoryname = filedialog.askdirectory() print(f"{directoryname=}") try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f"choose_dir提示:多张图片导入错误>>> {e}") try: if text.winfo_exists(): text.destroy() except NameError as e: print(f"choose_dir提示:多张图片导入错误>>> {e}") text = tk.Text(f_left, spacing1=5, spacing3=5) text.pack(fill="both", expand=True) for i in Path(directoryname).iterdir(): # 获取文件夹下的所有文件。 if Path(i).suffix.lower() in Img_type: File_url_list.append(i.as_posix()) # as_posix() 把Path型转为字符串。 else: pass File_url_list = set(File_url_list) for i in list(File_url_list): # 把文件写入到文本框中 text.insert("end", str(list(File_url_list).index(i) + 1) + ": " + i + " ") File_url_list = list(File_url_list) print(f"{File_url_list=}") def clear_file_list(): global File_url_list File_url_list.clear() try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f"clear_file_list提示:清空错误>>> {e}") try: if text.winfo_exists(): text.destroy() except NameError as e: print(f"clear_file_list提示:清空错误错误>>> {e}") def get_entry1(): # 设置换行间距变量值 global Row_space num = entry1.get() if num.isdigit(): if int(num) > 0: Row_space = int(num) else: entry1.delete(0, "end") entry1.insert(0, 15) Row_space = 15 def set_split_symbol(): global Split_symbol Split_symbol = entry2.get() print(f"{Split_symbol=}") def do_change(): if File_url_list: v.set("文字提取中,请稍后……") button_do.config(state="disable") # 使按钮不可用。 # ======================================== def main(): reader = make_reader() for i in File_url_list: content = change_to_character(i, reader, row_space=Row_space, split_symbol=Split_symbol, save_dir=Save_dir) read_text.delete(1.0, "end") for c in content: # i 为每一行的内容 c.sort(key=lambda x: x[0][0][0]) # 对每行的内容进行先后排序 for r in c: # print(r) read_text.insert("end", r[1] + Split_symbol) read_text.insert("end", " ") v.set("文字提取结束。") button_do.config(state="normal") # 恢复按钮可用。 # ======================================== t = Thread(target=main, daemon=True) t.start() else: v.set("请先选择图片!") def join_file(): v.set("文件开始合并。") filst = list(Path(Save_dir).iterdir()) # 获取文件夹中所有的文本文件。 with open(f"{Save_dir}/合并文件.txt", "w", encoding="utf8") as join_f: for f in filst: with open(f, "r", encoding="utf8") as r_f: read_con = r_f.read() join_f.write(f.name+" "+read_con + " ") time.sleep(1) v.set("文件合并完毕。") # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 f_top = tk.Frame(root, height=65, width=1100, bd=1, relief="flat") # "sunken" "raised","groove" 或 "ridge" f_top.pack_propagate(False) # 如果不加这个参数,当Frame框架中加入部件时,会自动变成底层窗口,自身的特性会消失。 f_top.pack(side="top", pady=5) f_left = tk.Frame(root, height=660, width=560, bd=1, relief="groove") f_left.pack_propagate(False) f_left.pack(side="left", padx=20) f_right = tk.Frame(root, height=660, width=560, bd=1, relief="groove") f_right.pack_propagate(False) f_right.pack(side="left", padx=20) read_text = tk.Text(f_right, spacing1=5, spacing3=5) read_text.pack(fill="both", expand=True) # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 button_choose_file = tk.Button(f_top, text="选择图片", command=choose_file) button_choose_file.pack(side="left", padx=10, ipadx=5) button_choose_file = tk.Button(f_top, text="选择文件夹", command=choose_dir) button_choose_file.pack(side="left", padx=10, ipadx=5) button_clear_file = tk.Button(f_top, text="清空选择", bg="#FFEF2F", command=clear_file_list) button_clear_file.pack(side="left", padx=5, ipadx=5) # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 f_row_content = tk.Frame(f_top, height=50, width=300, bg="#D1D4D0", relief="flat") # "sunken" "raised","groove" 或 "ridge" f_row_content.pack_propagate(False) f_row_content.pack(side="left", padx=15) button_set_row_height = tk.Button(f_row_content, text="设置行间距", command=get_entry1) button_set_row_height.pack(side="left", ipadx=3, padx=3) entry1 = tk.Entry(f_row_content, font=("", 18), width=3) entry1.insert(0, 15) entry1.pack(padx=5, side="left") tk.Label(f_row_content, justify="left", text="填入像素值,设置换行间距。 默认15个像素。").pack(side="left") # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 f_split = tk.Frame(f_top, height=50, width=215, bg="#D1D4D0", relief="flat") # "sunken" "raised","groove" 或 "ridge" f_split.pack_propagate(False) f_split.pack(side="left", padx=4) button_split = tk.Button(f_split, text="设置分隔符", command=set_split_symbol) button_split.pack(side="left", ipadx=3, padx=3) entry2 = tk.Entry(f_split, font=("", 18), width=3) entry2.insert(0, " ") entry2.pack(padx=5, side="left") tk.Label(f_split, justify="left", text="默认一个空格").pack(side="left") # 《《《《《《《《《《《《《《《《《《《《《《 提取 合并文件 》》》》》》》》》》》》》》》》》》》》》》》》》 button_do = tk.Button(f_top, text="开始提取", bg="#4AB0FF", command=do_change) button_do.pack(side="left", padx=10, ipadx=2) button_join = tk.Button(f_top, text="合并文件", command=join_file) button_join.pack(side="left", padx=5, ipadx=2) v = tk.StringVar() v.set("info……") tk.Label(f_top, bg="#2EBD1D", justify="left", textvariable=v).pack(side="left") # 《《《《《《《《《《《《《《《《《《《《《《 右键菜单 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 def copy_text(): read_text.event_generate("<<Copy>>") menubar = tk.Menu(tearoff=False) # root["menu"] = menubar # 没有把这个 菜单部件 加入到 root 窗口的菜单属性中,所以它不会在root窗口的顶部显示。 menubar.add_command(label="复制", command=copy_text) def show_menu(event): """用 菜单部件 的 post 方法展示菜单""" menubar.post(event.x_root, event.y_root) read_text.bind("<Button-3>", show_menu) # 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》 root.mainloop()
以上がPython EasyOCRライブラリの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











PHPは主に手順プログラミングですが、オブジェクト指向プログラミング(OOP)もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHPはWeb開発と迅速なプロトタイピングに適しており、Pythonはデータサイエンスと機械学習に適しています。 1.PHPは、単純な構文と迅速な開発に適した動的なWeb開発に使用されます。 2。Pythonには簡潔な構文があり、複数のフィールドに適しており、強力なライブラリエコシステムがあります。

Pythonは、スムーズな学習曲線と簡潔な構文を備えた初心者により適しています。 JavaScriptは、急な学習曲線と柔軟な構文を備えたフロントエンド開発に適しています。 1。Python構文は直感的で、データサイエンスやバックエンド開発に適しています。 2。JavaScriptは柔軟で、フロントエンドおよびサーバー側のプログラミングで広く使用されています。

VSコードはWindows 8で実行できますが、エクスペリエンスは大きくない場合があります。まず、システムが最新のパッチに更新されていることを確認してから、システムアーキテクチャに一致するVSコードインストールパッケージをダウンロードして、プロンプトとしてインストールします。インストール後、一部の拡張機能はWindows 8と互換性があり、代替拡張機能を探すか、仮想マシンで新しいWindowsシステムを使用する必要があることに注意してください。必要な拡張機能をインストールして、適切に動作するかどうかを確認します。 Windows 8ではVSコードは実行可能ですが、開発エクスペリエンスとセキュリティを向上させるために、新しいWindowsシステムにアップグレードすることをお勧めします。

VSコード拡張機能は、悪意のあるコードの隠れ、脆弱性の活用、合法的な拡張機能としての自慰行為など、悪意のあるリスクを引き起こします。悪意のある拡張機能を識別する方法には、パブリッシャーのチェック、コメントの読み取り、コードのチェック、およびインストールに注意してください。セキュリティ対策には、セキュリティ認識、良好な習慣、定期的な更新、ウイルス対策ソフトウェアも含まれます。

VSコードはPythonの書き込みに使用でき、Pythonアプリケーションを開発するための理想的なツールになる多くの機能を提供できます。ユーザーは以下を可能にします。Python拡張機能をインストールして、コードの完了、構文の強調表示、デバッグなどの関数を取得できます。デバッガーを使用して、コードを段階的に追跡し、エラーを見つけて修正します。バージョンコントロールのためにGitを統合します。コードフォーマットツールを使用して、コードの一貫性を維持します。糸くずツールを使用して、事前に潜在的な問題を発見します。

PHPは1994年に発信され、Rasmuslerdorfによって開発されました。もともとはウェブサイトの訪問者を追跡するために使用され、サーバー側のスクリプト言語に徐々に進化し、Web開発で広く使用されていました。 Pythonは、1980年代後半にGuidovan Rossumによって開発され、1991年に最初にリリースされました。コードの読みやすさとシンプルさを強調し、科学的コンピューティング、データ分析、その他の分野に適しています。

VSコードでは、次の手順を通じて端末でプログラムを実行できます。コードを準備し、統合端子を開き、コードディレクトリが端末作業ディレクトリと一致していることを確認します。プログラミング言語(pythonのpython your_file_name.pyなど)に従って実行コマンドを選択して、それが正常に実行されるかどうかを確認し、エラーを解決します。デバッガーを使用して、デバッグ効率を向上させます。
