Rumah pembangunan bahagian belakang Tutorial Python Cara menggunakan ungkapan biasa Python untuk padanan kata kunci

Cara menggunakan ungkapan biasa Python untuk padanan kata kunci

Jun 23, 2023 am 09:46 AM
python ungkapan biasa padanan kata kunci

Dengan perkembangan pesat Internet, sejumlah besar data teks dijana dan disimpan, dan pemprosesan data teks ini telah menjadi kemahiran yang diperlukan dalam kerja harian. Pemadanan kata kunci ialah salah satu tugas paling asas, biasa dan penting dalam proses perlombongan teks. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk pemadanan kata kunci.

1. Pengenalan kepada ungkapan biasa
Ungkapan biasa merujuk kepada ungkapan yang terdiri daripada beberapa aksara dan simbol khas, yang digunakan untuk memadankan corak beberapa rentetan teks. Corak ungkapan biasa dihimpun ke dalam bentuk yang serupa dengan automaton keadaan terhingga dan kemudian memadankan jujukan aksara dalam rentetan input.

2. Sintaks asas ungkapan biasa
Ungkapan biasa termasuk dua jenis: aksara biasa dan aksara khas. Watak biasa mewakili padanan diri mereka sendiri, seperti huruf seperti a, b, c, dsb. Aksara khas mewakili beberapa penggunaan khas, seperti d mewakili sebarang nombor, w mewakili sebarang huruf, nombor atau garis bawah.

Berikut ialah beberapa sintaks ungkapan biasa asas:

  1. Padan dengan mana-mana aksara kecuali baris baharu.
  2. [] sepadan dengan mana-mana aksara dalam kurungan.
  3. [^] sepadan dengan mana-mana aksara kecuali aksara dalam kurungan.
  4. d sepadan dengan sebarang nombor.
  5. D sepadan dengan mana-mana aksara kecuali nombor.
  6. s sepadan dengan mana-mana aksara ruang putih, termasuk ruang, tab, baris baharu, dsb.
  7. S sepadan dengan mana-mana aksara kecuali aksara ruang putih.
  8. w sepadan dengan mana-mana huruf, nombor atau garis bawah.
  9. W sepadan dengan mana-mana aksara kecuali huruf, nombor atau garis bawah.
    • sepadan dengan 0 atau lebih aksara sebelumnya.
    • sepadan dengan 1 atau lebih aksara sebelumnya.
  10. padan dengan 0 atau 1 aksara sebelumnya.
  11. {n} sepadan dengan aksara sebelumnya yang diulang n kali.
  12. {n,} sepadan dengan aksara sebelumnya yang diulang sekurang-kurangnya n kali.
  13. {n,m} sepadan dengan aksara sebelumnya yang diulang n hingga m kali.
  14. ^ sepadan dengan aksara pada permulaan baris.
  15. $ sepadan dengan aksara di hujung baris.
  16. () menangkap kandungan yang dipadankan dan boleh dipanggil selepas dipadankan.

3. Gunakan ungkapan biasa Python untuk pemadanan kata kunci
Modul semula Python menyediakan fungsi pengendalian yang berkaitan dengan ungkapan biasa, yang boleh digunakan untuk memadankan rentetan.

Berikut ialah beberapa fungsi ungkapan biasa yang biasa digunakan:

  1. re.match(pattern, string, flags=0): Padankan ungkapan biasa dari permulaan rentetan dan kembalikan objek perlawanan.
  2. re.search(pattern, string, flags=0): Padankan ungkapan biasa dalam keseluruhan rentetan dan kembalikan objek yang sepadan.
  3. re.findall(pattern, string, flags=0): Mengembalikan senarai yang mengandungi semua subrentetan yang sepadan dengan ungkapan biasa.
  4. re.sub(pattern, repl, string, count=0, flags=0): Gantikan substring yang dipadankan dengan rentetan baharu.

Berikut ialah contoh mudah yang menunjukkan cara menggunakan ungkapan biasa Python untuk pemadanan kata kunci:

import semula

text = "Python ialah bahasa pengaturcaraan yang hebat, ia mudah dipelajari dan digunakan."

kata kunci = "Python"

hasil = carian semula(kata kunci, teks)

jika hasil:

print("Keyword found in the text.")
Salin selepas log masuk

else:

print("Keyword not found in the text.")
Salin selepas log masuk

Dalam kod di atas, kami menggunakan fungsi re.search() untuk mencari sama ada kata kunci yang ditentukan wujud dalam teks. Jika kata kunci ditemui, objek yang sepadan dikembalikan, jika tidak Tiada dikembalikan.

4. Nota
Apabila menggunakan ungkapan biasa Python untuk pemadanan kata kunci, anda perlu memberi perhatian kepada perkara berikut:

  1. Padanan tepat: Apabila menulis ungkapan biasa, Pastikan bahawa rentetan yang dipadankan adalah betul-betul sama dengan kata kunci dan tidak sepatutnya terdapat perbezaan dalam kes, ruang, dsb.
  2. Padanan kata kunci berbilang: Jika anda perlu memadankan berbilang kata kunci, anda boleh menggabungkan kata kunci bersama-sama dan menggunakan simbol |
  3. Ekspresi biasa padanan tamak: Ungkapan biasa menggunakan padanan tamak secara lalai, iaitu, memadankan sebanyak mungkin aksara Jika anda tidak mahu menggunakan padanan tamak, anda boleh menambah ? sepadan.

5. Kesimpulan
Ekspresi biasa Python ialah salah satu alat yang paling biasa digunakan dalam perlombongan teks. Menguasai penggunaan sintaks ekspresi biasa dan fungsi berkaitan modul Python boleh meningkatkan kecekapan perlombongan teks kecekapan dan ketepatan. Saya harap artikel ini dapat membantu semua orang mempelajari ungkapan biasa Python.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk padanan kata kunci. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah fungsi jumlah bahasa C? Apakah fungsi jumlah bahasa C? Apr 03, 2025 pm 02:21 PM

Tiada fungsi jumlah terbina dalam dalam bahasa C, jadi ia perlu ditulis sendiri. Jumlah boleh dicapai dengan melintasi unsur -unsur array dan terkumpul: Versi gelung: SUM dikira menggunakan panjang gelung dan panjang. Versi Pointer: Gunakan petunjuk untuk menunjuk kepada unsur-unsur array, dan penjumlahan yang cekap dicapai melalui penunjuk diri sendiri. Secara dinamik memperuntukkan versi Array: Perlawanan secara dinamik dan uruskan memori sendiri, memastikan memori yang diperuntukkan dibebaskan untuk mengelakkan kebocoran ingatan.

Siapa yang dibayar lebih banyak Python atau JavaScript? Siapa yang dibayar lebih banyak Python atau JavaScript? Apr 04, 2025 am 12:09 AM

Tidak ada gaji mutlak untuk pemaju Python dan JavaScript, bergantung kepada kemahiran dan keperluan industri. 1. Python boleh dibayar lebih banyak dalam sains data dan pembelajaran mesin. 2. JavaScript mempunyai permintaan yang besar dalam perkembangan depan dan stack penuh, dan gajinya juga cukup besar. 3. Faktor mempengaruhi termasuk pengalaman, lokasi geografi, saiz syarikat dan kemahiran khusus.

Cara menukar XML ke mp3 Cara menukar XML ke mp3 Apr 03, 2025 am 09:00 AM

Langkah -langkah untuk menukar XML ke MP3 termasuk: Ekstrak data audio dari XML: menghuraikan fail XML, cari rentetan pengekodan base64 yang mengandungi data audio, dan ekodkannya ke dalam format binari. Kodkan data audio ke mp3: Pasang pengekod MP3 dan tetapkan parameter pengekodan, encang data audio binari ke format MP3, dan simpannya ke fail.

Adakah distinctidistinguish berkaitan? Adakah distinctidistinguish berkaitan? Apr 03, 2025 pm 10:30 PM

Walaupun berbeza dan berbeza berkaitan dengan perbezaan, ia digunakan secara berbeza: berbeza (kata sifat) menggambarkan keunikan perkara itu sendiri dan digunakan untuk menekankan perbezaan antara perkara; Berbeza (kata kerja) mewakili tingkah laku atau keupayaan perbezaan, dan digunakan untuk menggambarkan proses diskriminasi. Dalam pengaturcaraan, berbeza sering digunakan untuk mewakili keunikan unsur -unsur dalam koleksi, seperti operasi deduplikasi; Berbeza dicerminkan dalam reka bentuk algoritma atau fungsi, seperti membezakan ganjil dan bahkan nombor. Apabila mengoptimumkan, operasi yang berbeza harus memilih algoritma dan struktur data yang sesuai, sementara operasi yang berbeza harus mengoptimumkan perbezaan antara kecekapan logik dan memberi perhatian untuk menulis kod yang jelas dan mudah dibaca.

Bagaimana memahami! X dalam c? Bagaimana memahami! X dalam c? Apr 03, 2025 pm 02:33 PM

! X Memahami! X adalah bukan operator logik dalam bahasa C. Ia booleans nilai x, iaitu, perubahan benar kepada perubahan palsu, palsu kepada benar. Tetapi sedar bahawa kebenaran dan kepalsuan dalam C diwakili oleh nilai berangka dan bukannya jenis Boolean, bukan sifar dianggap sebagai benar, dan hanya 0 dianggap sebagai palsu. Oleh itu ,! X memperkatakan nombor negatif sama seperti nombor positif dan dianggap benar.

Bolehkah Pengenal Pengguna Bahasa C mengandungi ruang? Bolehkah Pengenal Pengguna Bahasa C mengandungi ruang? Apr 03, 2025 pm 01:51 PM

Pengenal bahasa C tidak boleh mengandungi ruang kerana mereka boleh menyebabkan kekeliruan dan kesukaran dalam mengekalkan. Peraturan khusus adalah seperti berikut: mereka mesti bermula dengan huruf atau garis bawah. Boleh mengandungi huruf, nombor, atau garis bawah. Tidak boleh mengandungi watak haram (seperti simbol khas).

Bagaimana cara menggunakan nomenclature ular dalam bahasa c? Bagaimana cara menggunakan nomenclature ular dalam bahasa c? Apr 03, 2025 pm 01:03 PM

Dalam bahasa C, nomenclature ular adalah konvensyen gaya pengekodan, yang menggunakan garis bawah untuk menyambungkan beberapa perkataan untuk membentuk nama pembolehubah atau nama fungsi untuk meningkatkan kebolehbacaan. Walaupun ia tidak akan menjejaskan kompilasi dan operasi, penamaan panjang, isu sokongan IDE, dan bagasi sejarah perlu dipertimbangkan.

Apakah jumlah maksud dalam bahasa C? Apakah jumlah maksud dalam bahasa C? Apr 03, 2025 pm 02:36 PM

Tiada fungsi jumlah terbina dalam dalam C untuk jumlah, tetapi ia boleh dilaksanakan dengan: menggunakan gelung untuk mengumpul unsur-unsur satu demi satu; menggunakan penunjuk untuk mengakses dan mengumpul unsur -unsur satu demi satu; Untuk jumlah data yang besar, pertimbangkan pengiraan selari.

See all articles