Rumah pembangunan bahagian belakang Tutorial Python Cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan

Cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan

Jun 22, 2023 pm 03:04 PM
ungkapan biasa python Pengekstrakan kandungan

Python ialah bahasa pengaturcaraan peringkat tinggi yang digunakan secara meluas dengan perpustakaan dan alatan yang kaya yang menjadikan pengekstrakan kandungan lebih mudah dan lebih cekap. Antaranya, ungkapan biasa adalah alat yang sangat penting, dan Python menyediakan modul semula untuk menggunakan ungkapan biasa untuk pengekstrakan kandungan. Artikel ini akan memperkenalkan anda kepada langkah khusus tentang cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan.

1. Fahami sintaks asas ungkapan biasa

Sebelum menggunakan ungkapan biasa Python untuk pengekstrakan kandungan, anda perlu memahami peraturan sintaks asas ungkapan biasa. Ungkapan biasa ialah corak teks yang digunakan untuk menerangkan corak aksara Sintaks asasnya termasuk yang berikut:

1 memadankan permulaan baris, '$' bermaksud memadankan hujung baris, dsb.

2. Set aksara: Menunjukkan bahawa ia boleh memadankan satu daripada berbilang aksara Contohnya: '[abc]' bermakna ia sepadan dengan mana-mana satu aksara 'a', 'b' dan 'c'.

3. Pengkuantiti: simbol yang menunjukkan bilangan padanan, seperti: '*' bermaksud memadankan sifar atau lebih kali, '+' bermaksud memadankan satu atau lebih kali, '?' bermaksud memadankan sifar atau satu masa , dsb.

4. Pengumpulan: Gabungkan berbilang aksara menjadi satu keseluruhan untuk dipadankan, contohnya: '(abc)' bermaksud memadankan keseluruhan 'abc'.

2 Gunakan modul semula untuk pemadanan ungkapan biasa

Dalam Python, alat utama untuk pengekstrakan kandungan menggunakan ungkapan biasa ialah modul semula. Modul ini menyediakan satu set fungsi yang memudahkan pemadanan ungkapan biasa.

Fungsi 1.re.match(): sepadan dengan ungkapan biasa pada permulaan rentetan. Jika perlawanan berjaya, objek sepadan dikembalikan jika perlawanan gagal, Tiada dikembalikan.

Kod sampel:

import re

# 匹配字符串中的数字
text = 'Hello 123456 World'
matchObj = re.match(r'd+', text)

if matchObj:
    print("matchObj.group() : ", matchObj.group())
else:
    print("No match!!")
Salin selepas log masuk

Hasil output:

matchObj.group() : 123456
Salin selepas log masuk
Salin selepas log masuk

Fungsi 2.re.search(): Padankan ungkapan biasa dalam keseluruhan rentetan. Jika perlawanan berjaya, objek sepadan dikembalikan jika perlawanan gagal, Tiada dikembalikan.

Kod sampel:

import re

# 搜索字符串中的数字
text = 'Hello 123456 World'
matchObj = re.search(r'd+', text)

if matchObj:
    print("matchObj.group() : ", matchObj.group())
else:
    print("No match!!")
Salin selepas log masuk

Hasil keluaran:

matchObj.group() : 123456
Salin selepas log masuk
Salin selepas log masuk

Fungsi 3.re.findall(): Cari semua subrentetan yang sepadan dengan ungkapan biasa dalam rentetan dan Kembalikan senarai .

Kod sampel:

import re

# 查找字符串中的所有数字
text = 'Hello 123456 World'
matchList = re.findall(r'd+', text)

print(matchList)
Salin selepas log masuk

Hasil keluaran:

['123456']
Salin selepas log masuk

Fungsi 4.re.sub(): Gantikan subrentetan yang sepadan dengan ungkapan biasa dalam rentetan.

Kod sampel:

import re

# 将字符串中的数字替换为'X'
text = 'Hello 123456 World'
newText = re.sub(r'd+', 'X', text)

print(newText)
Salin selepas log masuk

Hasil keluaran:

Hello X World
Salin selepas log masuk

3 Contoh analisis

Yang berikut menggunakan contoh untuk memahami lebih lanjut penggunaan ungkapan biasa Python .

Di Internet, banyak tapak web mempunyai sekatan perangkak dan memerlukan penggunaan kuki untuk pengesahan. Jadi bagaimana anda mengekstrak kuki daripada pengepala respons HTTP menggunakan ungkapan biasa Python? Sila lihat kod contoh di bawah:

import re

# 模拟HTTP响应头
responseHeader = '''
HTTP/1.1 200 OK
Content-Type: text/html; charset=utf-8
Set-Cookie: SESSIONID=1234567890abcdef; Domain=example.com; Path=/
Set-Cookie: USERNAME=admin; Domain=example.com; Path=/
'''

# 提取cookie
cookiePattern = r'Set-Cookie: (.+?);'
cookieList = re.findall(cookiePattern, responseHeader)

# 输出cookie
print(cookieList)
Salin selepas log masuk

Hasil keluaran:

['SESSIONID=1234567890abcdef', 'USERNAME=admin']
Salin selepas log masuk

Dengan menggunakan fungsi re.findall() dan corak ungkapan biasa 'Set-Cookie: (.+?);' , maklumat kuki boleh diekstrak dengan mudah daripada pengepala respons HTTP.

4. Ringkasan

Artikel ini memperkenalkan peraturan sintaks asas ungkapan biasa Python dan cara menggunakan modul semula untuk padanan ungkapan biasa. Melalui contoh khusus, ia menunjukkan cara menggunakan ungkapan biasa Python untuk mengekstrak kuki daripada pengepala respons HTTP. Ekspresi biasa ialah alat yang sangat penting dalam Python, yang boleh memudahkan pengekstrakan kandungan. Semoga artikel ini dapat membantu anda menjadi lebih baik dalam menggunakan Python untuk pengekstrakan kandungan.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara menggunakan ungkapan biasa Python untuk pemprosesan fail Word Cara menggunakan ungkapan biasa Python untuk pemprosesan fail Word Jun 22, 2023 am 09:57 AM

Ekspresi biasa Python ialah alat padanan yang berkuasa yang boleh membantu kami mengenal pasti dan menggantikan teks, gaya dan format dengan cepat dalam pemprosesan fail Word. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk pemprosesan fail Word. 1. Pasang perpustakaan Python-docx Python-docx ialah perpustakaan berfungsi untuk memproses dokumen Word dalam Python Anda boleh menggunakannya untuk membaca, mengubah suai, mencipta dan menyimpan dokumen Word dengan cepat. Sebelum menggunakan Python-docx, anda perlu memastikan

Cara menggunakan ungkapan biasa Python untuk memproses nombor dan jumlah Cara menggunakan ungkapan biasa Python untuk memproses nombor dan jumlah Jun 23, 2023 am 08:21 AM

Ungkapan biasa Python ialah alat berkuasa yang membantu kami melakukan pemadanan dan carian yang tepat dan cekap dalam data teks. Ungkapan biasa juga amat berguna dalam pemprosesan nombor dan jumlah, dan boleh mencari dan mengekstrak maklumat nombor dan jumlah dengan tepat. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk memproses nombor dan jumlah, membantu pembaca menangani tugas pemprosesan data sebenar dengan lebih baik. 1. Nombor proses 1. Padankan integer dan nombor titik terapung Dalam ungkapan biasa, untuk memadankan integer dan nombor titik terapung, anda boleh menggunakan d+ untuk padanan.

Cara menggunakan ungkapan biasa Python untuk orkestrasi kontena Cara menggunakan ungkapan biasa Python untuk orkestrasi kontena Jun 22, 2023 am 09:16 AM

Dalam orkestrasi kontena, kita selalunya perlu menapis, memadankan dan menggantikan beberapa maklumat. Python menyediakan ungkapan biasa, alat berkuasa yang boleh membantu kami menyelesaikan operasi ini. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk orkestrasi kontena, termasuk pengetahuan asas ungkapan biasa, cara menggunakan modul Pythonre dan beberapa aplikasi ungkapan biasa biasa. 1. Pengetahuan asas tentang ungkapan biasa Ungkapan biasa (RegularExpression) merujuk kepada corak teks, digunakan

Cara menggunakan ungkapan biasa Python untuk pembahagian perkataan Cara menggunakan ungkapan biasa Python untuk pembahagian perkataan Jun 23, 2023 am 10:37 AM

Ungkapan biasa Python ialah alat yang berkuasa untuk memproses data teks. Dalam pemprosesan bahasa semula jadi, pembahagian perkataan adalah tugas penting, yang memisahkan teks kepada perkataan individu. Dalam Python, kita boleh menggunakan ungkapan biasa untuk menyelesaikan tugas pembahagian perkataan. Berikut akan menggunakan Python3 sebagai contoh untuk memperkenalkan cara menggunakan ungkapan biasa untuk pembahagian perkataan. Import modul semula Modul semula ialah modul ekspresi biasa terbina dalam Python Anda perlu mengimport modul terlebih dahulu. teks definisi import

Cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan Cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan Jun 22, 2023 pm 03:04 PM

Python ialah bahasa pengaturcaraan peringkat tinggi yang digunakan secara meluas dengan set perpustakaan dan alatan yang kaya yang menjadikan pengekstrakan kandungan lebih mudah dan lebih cekap. Antaranya, ungkapan biasa adalah alat yang sangat penting, dan Python menyediakan modul semula untuk menggunakan ungkapan biasa untuk pengekstrakan kandungan. Artikel ini akan memperkenalkan anda kepada langkah khusus tentang cara menggunakan ungkapan biasa Python untuk pengekstrakan kandungan. 1. Fahami sintaks asas ungkapan biasa Sebelum menggunakan ungkapan biasa Python untuk pengekstrakan kandungan, anda perlu memahami sintaks asas ungkapan biasa.

Cara menggunakan ungkapan biasa Python untuk pemfaktoran semula kod Cara menggunakan ungkapan biasa Python untuk pemfaktoran semula kod Jun 23, 2023 am 09:44 AM

Dalam pengekodan harian, kita sering perlu mengubah suai dan membina semula kod untuk meningkatkan kebolehbacaan dan kebolehselenggaraan kod. Salah satu alat penting ialah ungkapan biasa. Artikel ini akan memperkenalkan beberapa teknik biasa tentang cara menggunakan ungkapan biasa Python untuk pemfaktoran semula kod. 1. Cari dan Ganti Salah satu fungsi ungkapan biasa yang paling biasa digunakan ialah cari dan ganti. Katakan kita perlu menggantikan semua kenyataan cetakan dalam kod dengan kenyataan log. Kita boleh menggunakan ungkapan biasa berikut untuk mencarinya: prints*((.

Cara menggunakan ungkapan biasa Python untuk struktur data dan algoritma Cara menggunakan ungkapan biasa Python untuk struktur data dan algoritma Jun 22, 2023 pm 08:01 PM

Ekspresi biasa Python ialah alat pemprosesan rentetan berdasarkan padanan corak, yang boleh membantu kami mengekstrak maklumat yang diperlukan daripada teks dengan cepat dan cekap. Dalam struktur data dan algoritma, ungkapan biasa boleh digunakan untuk melaksanakan pemadanan teks, penggantian, pembahagian dan fungsi lain, memberikan sokongan yang lebih berkuasa untuk pengaturcaraan kami. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk struktur data dan algoritma. 1. Pengetahuan asas ungkapan biasa Sebelum bermula, mari kita fahami beberapa pengetahuan asas ungkapan biasa: Set aksara: diwakili oleh kurungan segi empat sama,

Bagaimana untuk memproses kurungan pelbagai lapisan dalam formula lateks dengan ekspresi biasa Python dan perpustakaan parsing lateks? Bagaimana untuk memproses kurungan pelbagai lapisan dalam formula lateks dengan ekspresi biasa Python dan perpustakaan parsing lateks? Apr 01, 2025 pm 12:45 PM

Ekspresi biasa Python mengendalikan kurungan multi-lapisan lateks dan membina kamus pelbagai dimensi dengan banyak lateks ...

See all articles