Rumah pembangunan bahagian belakang Tutorial Python Cara menggunakan ungkapan biasa Python untuk pemprosesan bahasa semula jadi

Cara menggunakan ungkapan biasa Python untuk pemprosesan bahasa semula jadi

Jun 22, 2023 pm 03:28 PM
python ungkapan biasa pemprosesan bahasa semula jadi

Pemprosesan Bahasa Asli (NLP) ialah satu bidang sains komputer yang melibatkan cara komputer memproses dan memahami bahasa manusia. Python ialah bahasa pengaturcaraan yang digunakan secara meluas dengan set alat dan perpustakaan yang kaya untuk pemprosesan bahasa semula jadi. Antaranya, ungkapan biasa adalah alat yang berkuasa dan digunakan secara meluas dalam pemprosesan bahasa semula jadi. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk pemprosesan bahasa semula jadi.

1. Gambaran keseluruhan ungkapan biasa

Ungkapan biasa ialah corak yang digunakan untuk memadankan rentetan. Modul semula digunakan dalam Python untuk menyediakan sokongan ekspresi biasa. Dalam ungkapan biasa, terdapat beberapa aksara khas yang boleh digunakan untuk mewakili corak yang berbeza, seperti:

  1. ".": digunakan untuk memadankan mana-mana aksara.
  2. "^": digunakan untuk memadankan permulaan rentetan.
  3. "$": digunakan untuk memadankan hujung rentetan.
  4. "+": digunakan untuk memadankan satu atau lebih aksara sebelumnya.
  5. "*": digunakan untuk memadankan sifar atau lebih aksara sebelumnya.
  6. "?": digunakan untuk memadankan sifar atau satu aksara sebelumnya.

Watak istimewa ini boleh digunakan dengan huruf, nombor, ruang dan aksara lain untuk membentuk corak padanan yang kompleks.

2. Penggunaan asas ungkapan biasa Python

Dalam Python, gunakan modul semula untuk menyediakan fungsi ungkapan biasa. Berikut ialah contoh mudah untuk menyemak sama ada rentetan yang diberikan mengandungi nombor:

import re

# 匹配数字
pattern = 'd+'
result = re.search(pattern, 'hello 123 world')
if result:
    print('包含数字')
else:
    print('不包含数字')
Salin selepas log masuk

Output:

包含数字
Salin selepas log masuk

Dalam contoh ini, fungsi re.search() digunakan untuk mencari rentetan Carian yang diberikan rentetan untuk rentetan yang sepadan dengan corak yang ditentukan. Jika rentetan sepadan ditemui, fungsi mengembalikan objek MatchObject, jika tidak ia mengembalikan Tiada.

3. Penggunaan lanjutan ungkapan biasa Python

Dalam pemprosesan bahasa semula jadi, ungkapan biasa sering digunakan untuk tugas seperti penandaan sebahagian daripada pertuturan, pengecaman entiti dan pembahagian perkataan. Berikut ialah beberapa corak ungkapan biasa yang biasa digunakan dalam pemprosesan bahasa semula jadi dan penggunaannya:

  1. Perkataan yang sepadan

Ungkapan biasa boleh digunakan untuk memadankan perkataan. Sebagai contoh, kita boleh menggunakan " " untuk memadankan sempadan perkataan dan "w+" untuk memadankan satu atau lebih aksara perkataan, dengan itu memadankan perkataan:

import re

# 匹配单词
pattern = r'w+'
result = re.findall(pattern, 'hello world, how are you?')
print(result)
Salin selepas log masuk

Output:

['hello', 'world', 'how', 'are', 'you']
Salin selepas log masuk

Dalam contoh ini, Gunakan re.findall() berfungsi untuk mencari rentetan yang diberikan untuk semua rentetan yang sepadan dengan corak yang ditentukan dan mengembalikannya sebagai senarai.

  1. Padankan alamat e-mel

Ungkapan biasa juga boleh digunakan untuk memadankan alamat e-mel. Sebagai contoh, kita boleh menggunakan "w+@w+.w+" untuk memadankan format asas alamat e-mel:

import re

# 匹配邮箱地址
pattern = r'w+@w+.w+'
result = re.findall(pattern, 'my email is example@gmail.com')
print(result)
Salin selepas log masuk

Output:

['example@gmail.com']
Salin selepas log masuk

Dalam contoh ini, gunakan ungkapan biasa "w+@w+ .w+ "padanan dengan satu atau lebih aksara perkataan, diikuti dengan simbol "@", diikuti oleh satu atau lebih aksara perkataan, diikuti dengan simbol ".", dan akhirnya satu atau lebih aksara perkataan.

  1. Padankan Bahasa Cina

Ungkapan biasa juga boleh digunakan untuk memadankan bahasa Cina. Sebagai contoh, kita boleh menggunakan "[u4e00-u9fa5]+" untuk memadankan satu atau lebih aksara Cina:

import re

# 匹配中文
pattern = r'[u4e00-u9fa5]+'
result = re.findall(pattern, '中国人民是伟大的')
print(result)
Salin selepas log masuk

Output:

['中国人民是伟大的']
Salin selepas log masuk

Dalam contoh ini, gunakan ungkapan biasa "[u4e00- u9fa5]+" sepadan dengan satu atau lebih aksara Cina.

4. Kesimpulan

Ekspresi biasa Python adalah salah satu alat yang sangat diperlukan dalam pemprosesan bahasa semula jadi. Ia boleh digunakan untuk tugasan seperti padanan rentetan, penandaan sebahagian daripada pertuturan, pengecaman entiti, pembahagian perkataan, dsb., dan memainkan peranan penting dalam pemprosesan teks. Artikel ini memperkenalkan penggunaan asas dan lanjutan ungkapan biasa Python, dengan harapan dapat memberikan sedikit bantuan untuk aplikasi anda dalam pemprosesan bahasa semula jadi.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk pemprosesan bahasa semula jadi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara menjalankan program di terminal vscode Cara menjalankan program di terminal vscode Apr 15, 2025 pm 06:42 PM

Dalam kod VS, anda boleh menjalankan program di terminal melalui langkah -langkah berikut: Sediakan kod dan buka terminal bersepadu untuk memastikan bahawa direktori kod selaras dengan direktori kerja terminal. Pilih arahan Run mengikut bahasa pengaturcaraan (seperti python python your_file_name.py) untuk memeriksa sama ada ia berjalan dengan jayanya dan menyelesaikan kesilapan. Gunakan debugger untuk meningkatkan kecekapan debug.

Bolehkah kod studio visual digunakan dalam python Bolehkah kod studio visual digunakan dalam python Apr 15, 2025 pm 08:18 PM

Kod VS boleh digunakan untuk menulis Python dan menyediakan banyak ciri yang menjadikannya alat yang ideal untuk membangunkan aplikasi python. Ia membolehkan pengguna untuk: memasang sambungan python untuk mendapatkan fungsi seperti penyempurnaan kod, penonjolan sintaks, dan debugging. Gunakan debugger untuk mengesan kod langkah demi langkah, cari dan selesaikan kesilapan. Mengintegrasikan Git untuk Kawalan Versi. Gunakan alat pemformatan kod untuk mengekalkan konsistensi kod. Gunakan alat linting untuk melihat masalah yang berpotensi lebih awal.

Adakah sambungan vscode berniat jahat? Adakah sambungan vscode berniat jahat? Apr 15, 2025 pm 07:57 PM

Sambungan kod VS menimbulkan risiko yang berniat jahat, seperti menyembunyikan kod jahat, mengeksploitasi kelemahan, dan melancap sebagai sambungan yang sah. Kaedah untuk mengenal pasti sambungan yang berniat jahat termasuk: memeriksa penerbit, membaca komen, memeriksa kod, dan memasang dengan berhati -hati. Langkah -langkah keselamatan juga termasuk: kesedaran keselamatan, tabiat yang baik, kemas kini tetap dan perisian antivirus.

Boleh kod vs dijalankan di Windows 8 Boleh kod vs dijalankan di Windows 8 Apr 15, 2025 pm 07:24 PM

Kod VS boleh dijalankan pada Windows 8, tetapi pengalaman mungkin tidak hebat. Mula -mula pastikan sistem telah dikemas kini ke patch terkini, kemudian muat turun pakej pemasangan kod VS yang sepadan dengan seni bina sistem dan pasangnya seperti yang diminta. Selepas pemasangan, sedar bahawa beberapa sambungan mungkin tidak sesuai dengan Windows 8 dan perlu mencari sambungan alternatif atau menggunakan sistem Windows yang lebih baru dalam mesin maya. Pasang sambungan yang diperlukan untuk memeriksa sama ada ia berfungsi dengan betul. Walaupun kod VS boleh dilaksanakan pada Windows 8, disyorkan untuk menaik taraf ke sistem Windows yang lebih baru untuk pengalaman dan keselamatan pembangunan yang lebih baik.

Python: Automasi, skrip, dan pengurusan tugas Python: Automasi, skrip, dan pengurusan tugas Apr 16, 2025 am 12:14 AM

Python cemerlang dalam automasi, skrip, dan pengurusan tugas. 1) Automasi: Sandaran fail direalisasikan melalui perpustakaan standard seperti OS dan Shutil. 2) Penulisan Skrip: Gunakan Perpustakaan Psutil untuk memantau sumber sistem. 3) Pengurusan Tugas: Gunakan perpustakaan jadual untuk menjadualkan tugas. Kemudahan penggunaan Python dan sokongan perpustakaan yang kaya menjadikannya alat pilihan di kawasan ini.

Apa itu vscode untuk apa vscode? Apa itu vscode untuk apa vscode? Apr 15, 2025 pm 06:45 PM

VS Kod adalah nama penuh Visual Studio Code, yang merupakan editor kod dan persekitaran pembangunan yang dibangunkan oleh Microsoft. Ia menyokong pelbagai bahasa pengaturcaraan dan menyediakan penonjolan sintaks, penyiapan automatik kod, coretan kod dan arahan pintar untuk meningkatkan kecekapan pembangunan. Melalui ekosistem lanjutan yang kaya, pengguna boleh menambah sambungan kepada keperluan dan bahasa tertentu, seperti debuggers, alat pemformatan kod, dan integrasi Git. VS Kod juga termasuk debugger intuitif yang membantu dengan cepat mencari dan menyelesaikan pepijat dalam kod anda.

Bolehkah kod studio visual menjalankan python Bolehkah kod studio visual menjalankan python Apr 15, 2025 pm 08:00 PM

VS Kod bukan sahaja boleh menjalankan Python, tetapi juga menyediakan fungsi yang kuat, termasuk: mengenal pasti fail python secara automatik selepas memasang sambungan python, menyediakan penyelesaian kod, penonjolan sintaks, debugging dan fungsi lain. Bergantung pada persekitaran python yang dipasang, sambungan bertindak sebagai penyuntingan sambungan jambatan dan persekitaran python. Fungsi debugging termasuk menetapkan titik putus, debugging langkah demi langkah, melihat nilai berubah, dan meningkatkan kecekapan debugging. Terminal bersepadu menyokong arahan kompleks seperti ujian unit dan pengurusan pakej. Menyokong konfigurasi lanjutan dan meningkatkan ciri -ciri seperti pemformatan kod, analisis dan kawalan versi.

Boleh vs kod berjalan python Boleh vs kod berjalan python Apr 15, 2025 pm 08:21 PM

Ya, kod vs boleh menjalankan kod python. Untuk menjalankan Python dengan cekap dalam kod VS, lengkapkan langkah -langkah berikut: Pasang penterjemah Python dan konfigurasikan pembolehubah persekitaran. Pasang pelanjutan python dalam kod vs. Jalankan kod Python dalam terminal Vs Code melalui baris arahan. Gunakan keupayaan debugging VS dan pemformatan kod untuk meningkatkan kecekapan pembangunan. Mengamalkan tabiat pengaturcaraan yang baik dan gunakan alat analisis prestasi untuk mengoptimumkan prestasi kod.

See all articles