Memadankan dan Menangkap Subcorak Berulang dalam Python Regex
Apabila memadankan corak kompleks seperti alamat e-mel, selalunya perlu menangkap subcorak berulang. Sebagai contoh, dalam alamat e-mel seperti "yasar@webmail.something.edu.tr", kita perlu menangkap bahagian domain ".something" dan ".edu." Regex menyediakan cara untuk melakukan ini melalui kumpulan penangkapan berulang. Walau bagaimanapun, modul semula Python tidak menyokongnya sepenuhnya.
Pilihan 1: Menggunakan Modul semula Python
Jika anda cuba menggunakan corak seperti (.w ) dengan semula, ia hanya akan menangkap kumpulan padanan terakhir dan bukannya semua kejadian. Contohnya, dengan [email protected], ia hanya akan menangkap ".tr" dan terlepas ".something" dan ".edu."
Pilihan 2: Membahagi dan Memadankan Kemudian
Seperti yang dicadangkan oleh jawapan yang diberikan, pendekatan yang lebih mudah dalam Python ialah memadankan segala-galanya pada mulanya dan kemudian memisahkan subcorak yang ditangkap menggunakan manipulasi rentetan. Ini boleh menjadi lebih mudah untuk dibaca dan dilaksanakan. Contohnya:
import re # Match the entire email address email_pattern = re.compile(r'([^\s@]+)@(\w+\.\w+)') match = email_pattern.match('[email protected]') if match: # Split the domain portion domain = match.group(2) domain_parts = domain.split('.') print('Domain Parts:', domain_parts)
Kod ini menangkap keseluruhan alamat e-mel dan kemudian membahagikan domain kepada bahagiannya, membolehkan kami mengakses dan menyimpan setiap subcorak secara berasingan.
Atas ialah kandungan terperinci Bagaimanakah Anda Boleh Menangkap Subcorak Berulang dalam Python Regex?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!