Sempadan Perkataan dan Aksara Khas dalam Python
Apabila menggunakan corak b untuk pemadanan sempadan perkataan dalam ungkapan biasa Python, hasil yang tidak dijangka boleh berlaku apabila corak carian mengandungi aksara khas seperti kurungan atau pendakap.
Secara khusus, b sahaja sepadan pada sempadan perkataan yang mana aksara seterusnya ialah aksara perkataan (abjad angka atau garis bawah). Ini bermakna bSortesindex[persons]{Sortes}, sebagai contoh, tidak akan sepadan dengan ujian Sortesindex[persons]{Sortes} teks kerana Sortes mempunyai aksara khas (}index) selepasnya.
Untuk memastikan padanan yang betul, pertimbangkan penyelesaian ini:
Kata Suai Sempadan:
Gunakan sempadan perkataan penyesuaian yang sepadan pada permulaan atau akhir rentetan atau antara aksara dengan status aksara perkataan yang berbeza:
re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
Perkataan Tidak Jelas Sempadan:
Gunakan sempadan perkataan yang tidak jelas untuk sama sekali tidak memerlukan aksara perkataan pada kedua-dua belah perlawanan:
re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
Mengendalikan Bukan Perkataan Secara Eksplisit Sempadan:
Kendalikan sempadan bukan perkataan secara eksplisit menggunakan W atau $, seperti:
re.search(r'\b' + re.escape('Sortes\index[persons]{Sortes}') + '(\W|$)', 'test Sortes\index[persons]{Sortes} test')
Selain itu, pertimbangkan untuk menggunakan tinjauan negatif untuk lebih fleksibiliti dalam mentakrifkan sempadan perkataan. Sebagai contoh, (?
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memadankan Rentetan dengan Watak Khas Menggunakan Sempadan Kata Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!