Bagaimana untuk menukar imej kepada teks dalam python-Tutorial Python-php.cn

Bagaimana untuk menukar imej kepada teks dalam python

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Lepaskan： 2023-04-20 11:07:06

ke hadapan

2209 orang telah melayarinya

Imej Python ke teks

Saya menggunakan python+Tesseract-OCR untuk membuat imej kecil kepada alat teks, dan reka bentuk GUI menggunakan kawalan perpustakaan tkinter

Antara muka dan kesan ditunjukkan dalam gambar di bawah:

Bagaimana untuk menukar imej kepada teks dalam python

#进一步优化  1. 底部添加label   2.对识别后的文本处理，去空格


from PIL import Image as PImage
from PIL import ImageTk
import pytesseract
from tkinter import *
from tkinter import filedialog
from tkinter.scrolledtext import ScrolledText
import re

# 将图片内容翻译为文字，显示在文本框内
def trans():
    contents.delete(&#39;1.0&#39;, END)
    transTxt = pytesseract.image_to_string(PImage.open(filePath.get()),lang=&#39;chi_sim&#39;)
    #对transTxt进行处理  去空格，换行符去重
    transTxt = transTxt.strip(&#39;\n\r&#39;)   #无参数可以删除开头结尾的空格\n\t\r
    print(transTxt)
    contents.insert( INSERT, transTxt.replace(&#39; &#39;,&#39;&#39;).replace(&#39;\n\n&#39;,&#39;\n&#39;).replace(&#39;\r&#39;,&#39;&#39;))

#打开图片文件，显示路径，并将图片展现
def openfile():
    filename.delete(&#39;1.0&#39;, END)
    filePath.set(filedialog.askopenfilename())
    filename.insert(1.0,filePath.get())
    org_img = PImage.open(filePath.get())
    #调整图片显示大小 600*800
    w,h = org_img.size
    if w>600:
        h=int(h*600/w)
        w=600
    if h>800:
        w=int(w*800/h)
        h=800
    img = ImageTk.PhotoImage(org_img.resize((w,h)))
    showPic.config(image=img)
    showPic.image = img       #保持一个引用才能显示图片，tkinter的BUG
    

#设置主窗口
top = Tk()
top.title("OCR图片转文字  引擎：Tesseract-OCR  Made by: kaivis")
#top.iconbitmap("./pic/y1.ico")
top.geometry("1200x800")

filePath=StringVar()

bt_img1 = ImageTk.PhotoImage( file= "./pic/Outbox1.png")
bt_img2 = ImageTk.PhotoImage( file= "./pic/bt_img2.png")

#第一个窗体
frame1 = Frame (top, relief=RAISED, borderwidth=2)
frame1.pack(side=TOP, fill=BOTH,  ipady=5, expand=0)
Label(frame1,height=1,text="图片路径：").pack(side=LEFT)
filename = Text(frame1,height=2)
filename.pack(side=LEFT,padx=1, pady=0,expand=True, fill=X)
Button(frame1,text="打开文件", image=bt_img1, command=openfile).pack(side=LEFT,padx=5, pady=0)
Button(frame1,text="中文识别", image=bt_img2, command=trans).pack(side=LEFT,padx=5, pady=0)

#第二个窗体
frame2 = Frame (top, relief=RAISED, borderwidth=2)
frame2.pack (side=LEFT, fill=BOTH,  expand=1)
Label(frame2,text=&#39;图片显示：&#39;,borderwidth=5).pack(side=TOP,padx=20,pady=5)
showPic = Label(frame2,text=&#39;图片显示区&#39;)
showPic.pack(side=BOTTOM,expand=1,fill=BOTH)

#第三个窗体
frame3 = Frame (top)
frame3.pack (side=RIGHT, fill=BOTH,  expand=1)
#contents = ScrolledText(frame3)
Label(frame3,text=&#39;识别结果：&#39;,borderwidth=5).pack(side=TOP,padx=20,pady=10)
contents = Text(frame3,font=(&#39;Arial&#39;,15))
contents.pack(side=TOP,expand=1,fill=BOTH)
Label(frame3,text=&#39;Copyright 2021 baidu.com ALL Rights Reserved&#39;,borderwidth=5).pack(side=BOTTOM,padx=20,pady=10)

top.mainloop()

Salin selepas log masuk

Masalah sedia ada:

Kadar pengecaman tidak tinggi, malah lebih sukar untuk mencapai ketepatan yang tinggi untuk aksara Cina padat. Adakah terdapat enjin OCR yang lebih baik?
Teks yang diiktiraf telah Selepas mengalih keluar ruang, teks boleh dioptimumkan lagi, terutamanya pemisah baris berlebihan yang perlu diproses

Tangkapan skrin Python ke fungsi teks

Kerana apabila mencari maklumat di Internet, saya sering Apabila saya menghadapi situasi di mana artikel tidak dapat disalin, untuk menyalin teks yang saya inginkan dengan cepat, saya ingin menulis program ular sawa untuk merealisasikan fungsi menukar tangkapan skrin menjadi teks .

Bagaimana untuk menukar imej kepada teks dalam python

1. Idea

Pertama sekali, anda mesti mempunyai fungsi merakam papan kekunci (beritahu program bahawa anda sedang mengambil tangkapan skrin) - perpustakaan papan kekunci perlu menerima imej selepas mengambil tangkapan skrin - Pustaka ImageGrab Selepas mendapatkan imej, pengecaman teks diperlukan - API Pengecaman Teks AI Baidu

2.1 perpustakaan berkaitan

Bagaimana untuk menukar imej kepada teks dalam python 2.2 Buat kelas dan tulis fungsi untuk menyimpan tangkapan skrin

Memandangkan saya menggunakan perisian tangkapan skrin yang disertakan dengan win10, kekunci pintas tangkapan skrin ialah ‘win+shift+s’, anda boleh menukarnya secara bebas mengikut perisian tangkapan skrin yang berbeza.

Bagaimana untuk menukar imej kepada teks dalam python 2.3 Tulis fungsi untuk menukar imej kepada teks

Mula-mula pergi ke laman web rasmi Baidu Smart Cloud untuk memohon pengecaman imej API.

Tulis parameter ke dalam atur cara: Bagaimana untuk menukar imej kepada teks dalam python

Tulis fungsi penukaran teks: Bagaimana untuk menukar imej kepada teks dalam python

Bagaimana untuk menukar imej kepada teks dalam python 2.5 Buat kelas semasa menjalankan

dan panggil dua fungsi:

Bagaimana untuk menukar imej kepada teks dalam python 2.6 Kesan

Jalankan program dan ambil tangkapan skrin artikel dalam Perpustakaan Baidu:

Hasilnya adalah seperti berikut: Bagaimana untuk menukar imej kepada teks dalam python

Bagaimana untuk menukar imej kepada teks dalam python Nota:

Dapat dilihat dari hasil larian 2.6 kesannya masih bagus. Menyelesaikan dengan sempurna keperluan semasa saya.

Atas ialah kandungan terperinci Bagaimana untuk menukar imej kepada teks dalam python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!