Cara menggunakan ungkapan biasa Python untuk padanan kata kunci

WBOY
Lepaskan: 2023-06-23 09:46:53
asal
3414 orang telah melayarinya

Dengan perkembangan pesat Internet, sejumlah besar data teks dijana dan disimpan, dan pemprosesan data teks ini telah menjadi kemahiran yang diperlukan dalam kerja harian. Pemadanan kata kunci ialah salah satu tugas paling asas, biasa dan penting dalam proses perlombongan teks. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk pemadanan kata kunci.

1. Pengenalan kepada ungkapan biasa
Ungkapan biasa merujuk kepada ungkapan yang terdiri daripada beberapa aksara dan simbol khas, yang digunakan untuk memadankan corak beberapa rentetan teks. Corak ungkapan biasa dihimpun ke dalam bentuk yang serupa dengan automaton keadaan terhingga dan kemudian memadankan jujukan aksara dalam rentetan input.

2. Sintaks asas ungkapan biasa
Ungkapan biasa termasuk dua jenis: aksara biasa dan aksara khas. Watak biasa mewakili padanan diri mereka sendiri, seperti huruf seperti a, b, c, dsb. Aksara khas mewakili beberapa penggunaan khas, seperti d mewakili sebarang nombor, w mewakili sebarang huruf, nombor atau garis bawah.

Berikut ialah beberapa sintaks ungkapan biasa asas:

  1. Padan dengan mana-mana aksara kecuali baris baharu.
  2. [] sepadan dengan mana-mana aksara dalam kurungan.
  3. [^] sepadan dengan mana-mana aksara kecuali aksara dalam kurungan.
  4. d sepadan dengan sebarang nombor.
  5. D sepadan dengan mana-mana aksara kecuali nombor.
  6. s sepadan dengan mana-mana aksara ruang putih, termasuk ruang, tab, baris baharu, dsb.
  7. S sepadan dengan mana-mana aksara kecuali aksara ruang putih.
  8. w sepadan dengan mana-mana huruf, nombor atau garis bawah.
  9. W sepadan dengan mana-mana aksara kecuali huruf, nombor atau garis bawah.
    • sepadan dengan 0 atau lebih aksara sebelumnya.
    • sepadan dengan 1 atau lebih aksara sebelumnya.
  10. padan dengan 0 atau 1 aksara sebelumnya.
  11. {n} sepadan dengan aksara sebelumnya yang diulang n kali.
  12. {n,} sepadan dengan aksara sebelumnya yang diulang sekurang-kurangnya n kali.
  13. {n,m} sepadan dengan aksara sebelumnya yang diulang n hingga m kali.
  14. ^ sepadan dengan aksara pada permulaan baris.
  15. $ sepadan dengan aksara di hujung baris.
  16. () menangkap kandungan yang dipadankan dan boleh dipanggil selepas dipadankan.

3. Gunakan ungkapan biasa Python untuk pemadanan kata kunci
Modul semula Python menyediakan fungsi pengendalian yang berkaitan dengan ungkapan biasa, yang boleh digunakan untuk memadankan rentetan.

Berikut ialah beberapa fungsi ungkapan biasa yang biasa digunakan:

  1. re.match(pattern, string, flags=0): Padankan ungkapan biasa dari permulaan rentetan dan kembalikan objek perlawanan.
  2. re.search(pattern, string, flags=0): Padankan ungkapan biasa dalam keseluruhan rentetan dan kembalikan objek yang sepadan.
  3. re.findall(pattern, string, flags=0): Mengembalikan senarai yang mengandungi semua subrentetan yang sepadan dengan ungkapan biasa.
  4. re.sub(pattern, repl, string, count=0, flags=0): Gantikan substring yang dipadankan dengan rentetan baharu.

Berikut ialah contoh mudah yang menunjukkan cara menggunakan ungkapan biasa Python untuk pemadanan kata kunci:

import semula

text = "Python ialah bahasa pengaturcaraan yang hebat, ia mudah dipelajari dan digunakan."

kata kunci = "Python"

hasil = carian semula(kata kunci, teks)

jika hasil:

print("Keyword found in the text.")
Salin selepas log masuk

else:

print("Keyword not found in the text.")
Salin selepas log masuk

Dalam kod di atas, kami menggunakan fungsi re.search() untuk mencari sama ada kata kunci yang ditentukan wujud dalam teks. Jika kata kunci ditemui, objek yang sepadan dikembalikan, jika tidak Tiada dikembalikan.

4. Nota
Apabila menggunakan ungkapan biasa Python untuk pemadanan kata kunci, anda perlu memberi perhatian kepada perkara berikut:

  1. Padanan tepat: Apabila menulis ungkapan biasa, Pastikan bahawa rentetan yang dipadankan adalah betul-betul sama dengan kata kunci dan tidak sepatutnya terdapat perbezaan dalam kes, ruang, dsb.
  2. Padanan kata kunci berbilang: Jika anda perlu memadankan berbilang kata kunci, anda boleh menggabungkan kata kunci bersama-sama dan menggunakan simbol |
  3. Ekspresi biasa padanan tamak: Ungkapan biasa menggunakan padanan tamak secara lalai, iaitu, memadankan sebanyak mungkin aksara Jika anda tidak mahu menggunakan padanan tamak, anda boleh menambah ? sepadan.

5. Kesimpulan
Ekspresi biasa Python ialah salah satu alat yang paling biasa digunakan dalam perlombongan teks. Menguasai penggunaan sintaks ekspresi biasa dan fungsi berkaitan modul Python boleh meningkatkan kecekapan perlombongan teks kecekapan dan ketepatan. Saya harap artikel ini dapat membantu semua orang mempelajari ungkapan biasa Python.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk padanan kata kunci. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan