Pemprosesan imej Python: Pustaka bantal melaksanakan anotasi teks pembalut baris automatik
Python telah menjadi bahasa pengaturcaraan terkemuka dalam bidang pemprosesan imej dengan perpustakaan sumber terbuka yang kaya. Bantal adalah salah satu perpustakaan pemprosesan imej yang biasa digunakan. Ia mudah, mudah digunakan dan mempunyai dokumentasi yang lengkap Ia sering digunakan untuk operasi seperti penskalaan imej, pemangkasan, pelarasan kecerahan dan anotasi.
Walau bagaimanapun, Bantal menghadapi masalah dengan anotasi teks: apabila teks melebihi lebar kotak teks, ia tidak akan membalut secara automatik. Perpustakaan Bantal sendiri tidak menyediakan fungsi ini, dan kita perlu menulis pelaksanaan logik sendiri.
Tutorial ini akan menunjukkan cara menggunakan perpustakaan Bantal untuk menambah kotak teks pembalut perkataan dalam Python untuk mencapai anotasi teks imej yang betul. Kesan akhir adalah seperti berikut:
Gambar di atas adalah tangkapan skrin profil Dev.to saya, kami akan menggunakan ini sebagai contoh untuk menerangkan. Kotak teks hijau ialah anotasi teks yang kami tambahkan.
Tutorial ini memerlukan anda mempunyai pengetahuan pengaturcaraan Python asas, seperti pernyataan bersyarat (jika, lain), untuk gelung, dsb. Anda juga memerlukan alatan dan perisian berikut:
Ikuti langkah ini untuk mencipta projek baharu:
A. Cipta folder baharu menggunakan terminal/baris arahan:
<code class="language-bash">mkdir image_annotation</code>
B. Gunakan pip untuk memasang virtualenv (langkau langkah ini jika anda telah memasangnya):
<code class="language-bash">pip install virtualenv</code>
C Tukar direktori kerja ke folder gambar_anotasi:
<code class="language-bash">cd image_annotation</code>
D. Cipta persekitaran maya baharu:
<code class="language-bash">virtualenv env</code>
E. Aktifkan persekitaran maya (gunakan command prompt untuk Windows):
Tingkap:
<code class="language-bash">.\env\Scripts\activate</code>
Linux/macOS:
<code class="language-bash">source env/bin/activate</code>
F. Gunakan pip untuk memasang perpustakaan Bantal:
<code class="language-bash">pip install pillow</code>
Buka projek dalam editor kod dan buat fail Python baharu bernama script.py
dalam folder projek.
Imej yang anda ingin beri anotasi ialah imej asas. Buka dan sediakan imej menggunakan modul ImageDraw
Bantal. Tulis kod berikut dalam fail script.py
:
<code class="language-python">from PIL import Image, ImageDraw, ImageFont image_file = "path_to_image" # 请替换为您的图片路径 # 打开图像 image = Image.open(image_file) # 初始化ImageDraw draw = ImageDraw.Draw(image)</code>
Bantal boleh menambah teks biasa dan kotak teks dengan pengisian latar belakang Teks boleh menjadi satu baris atau berbilang baris. Tutorial ini memberi tumpuan kepada cara menambah kotak teks berbilang baris.
KaedahImageDraw.multiline_text()
boleh menambah berbilang baris teks biasa, tetapi tiada pelapik latar belakang. Kaedah ImageDraw.rectangle()
boleh menambah kotak teks dengan isian latar belakang.
Tambah kod berikut dalam fail script.py
:
<code class="language-bash">mkdir image_annotation</code>
Kod ini menetapkan teks, fon dan lebar kotak teks. Pembolehubah x
dan y
mewakili titik permulaan lukisan, dan end_x
dan end_y
mewakili koordinat sudut kanan bawah kotak teks. Lebar dan tinggi kotak teks ialah 200 dan 50 masing-masing.
ImageDraw.rectangle()
dan ImageDraw.multiline_text()
digunakan untuk melukis kotak teks dan teks berbilang baris masing-masing. Kaedah image.show()
digunakan untuk memaparkan imej yang diproses. Anda boleh menyimpan imej menggunakan image.save("new_image.png")
. Keputusan adalah seperti berikut:
Masih terdapat masalah dengan anotasi dalam gambar di atas dan teks berbilang baris tidak dibalut secara automatik. Bahagian seterusnya menerangkan cara menyelesaikan masalah ini.
Watak pemisah baris n
digunakan untuk menentukan kedudukan pemisah baris. Dalam contoh sebelumnya, kandungan selepas aksara baris baharu n
akan dibalut. Tetapi dalam aplikasi praktikal, panjang teks biasanya dinamik dan sukar untuk menentukan kedudukan watak baris baharu.
modul ImageDraw
Pillow's .textlength()
boleh mengira panjang teks dan membandingkannya dengan lebar kotak teks untuk menentukan kedudukan pemisah baris.
Buat fungsi baharu bernama script.py
di bahagian atas fail wrap_text()
(selepas pernyataan import), yang mengandungi logik bungkus perkataan:
<code class="language-bash">pip install virtualenv</code>
Tambah kod berikut selepas pembolehubah text
, font
, max_width
:
<code class="language-bash">cd image_annotation</code>
Ganti kaedah draw.multiline_text()
dengan kod berikut:
<code class="language-bash">virtualenv env</code>
Alih keluar baris baharu daripada teks n
dan jalankan kod:
<code class="language-bash">.\env\Scripts\activate</code>
Hasil berjalan menunjukkan bahawa teks masih melebihi ketinggian kotak teks. Walaupun teks secara automatik melaraskan kepada lebar kotak teks, ketinggian kotak teks ditetapkan, menyebabkan teks melimpah.
Ketinggian kotak teks dinamik ditentukan berdasarkan bilangan baris teks. Langkah pertama ialah menukar pembolehubah end_y
kotak teks kepada nilai dinamik:
<code class="language-bash">source env/bin/activate</code>
Formula ini dicapai selepas banyak percubaan dan ia nampaknya merupakan penyelesaian terbaik untuk mendapatkan ketinggian kotak teks dinamik dalam kes penggunaan ini. wrapped_lines
Senarai mengandungi semua baris yang akan ditambahkan pada kotak teks, jadi panjang senarai adalah sama dengan jumlah bilangan baris kotak teks.
Keputusan adalah seperti berikut:
Anda mungkin perlu mendarabkan jumlah bilangan baris dengan nilai yang berbeza untuk mendapatkan penyelesaian yang sempurna untuk kes penggunaan anda.
Teks terlalu dekat dengan tepi kotak teks, menjejaskan kebolehbacaan dan gaya. Anda boleh menyelesaikan masalah ini dengan menambahkan padding di dalam kotak teks. Tambah pembolehubah script.py
baharu dalam fail padding
dan tukar saiz kotak teks:
<code class="language-bash">pip install pillow</code>
Kod ini membenarkan jarak antara teks dan tepi kotak teks.
Penunjuk boleh menunjukkan dengan mudah bahagian imej yang dirujuk oleh anotasi/label. Penunjuk hendaklah sebelum label. Ini bermakna penunjuk akan dilukis pada kedudukan semasa kotak teks dan kotak teks akan bergerak ke kanan.
Oleh itu, paksi-x kotak teks akan dikaitkan dengan pembolehubah box_x
baharu. Perubahan ini juga mesti ditunjukkan dalam pembolehubah lain menggunakan paksi x kotak teks. Berikut ialah kod yang dikemas kini:
<code class="language-bash">mkdir image_annotation</code>
Dalam kod di atas, kaedah ImageDraw.circle()
(di mana 10 ialah jejari) digunakan untuk melukis penunjuk pada titik yang ditentukan. box_x
Pembolehubah ialah nilai baharu paksi-x kotak teks.
Berikut ialah kod lengkap fail script.py
:
<code class="language-bash">pip install virtualenv</code>
Pemprosesan imej tidak selalunya sesukar yang disangka. Walaupun sesetengah perpustakaan pemprosesan imej tidak dapat menyelesaikan masalah anda secara langsung dengan modul mereka, anda boleh menggunakan modul sedia ada untuk melaksanakan penyelesaian khusus untuk kes penggunaan anda. Itulah keindahan pengekodan – dapat menyelesaikan masalah dengan penyelesaian tersuai dan khusus.
Dalam tutorial ini, anda mempelajari cara menggunakan perpustakaan Bantal Python untuk menganotasi imej, menambah kotak teks berbilang baris yang dibalut perkataan dan banyak lagi. Anda juga belajar cara menulis formula matematik yang boleh membantu anda dengan pemprosesan imej.
Sila rujuk dokumentasi Bantal untuk butiran mengenai modul yang digunakan.
Atas ialah kandungan terperinci Balut dan Render Teks Berbilang Baris pada Imej Menggunakan Perpustakaan Bantal Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!