Membuang Aksara Bukan Abjad Angka daripada Rentetan dalam Python
Membuang aksara bukan abjad angka daripada rentetan melibatkan pengalihan aksara selain daripada huruf, nombor dan menggariskan. Walaupun penyelesaian wujud untuk PHP, penyelesaian tersebut mungkin tidak sejajar dengan prinsip Pythonic.
Satu kaedah yang cekap ialah dengan mentakrifkan ungkapan biasa yang sepadan dengan aksara bukan abjad angka (W_) dan menggantikannya dengan rentetan kosong. Menggunakan fungsi re.sub() bersama-sama dengan corak ungkapan biasa yang disusun:
<code class="python">import re, string pattern = re.compile('[\W_]+') # Compiled regular expression string.printable = string.printable.replace(pattern, '') # Substitute non-alphanumeric characters with empty string</code>
Kaedah lain termasuk menggunakan pemahaman senarai untuk menapis aksara bukan abjad angka atau menggunakan kaedah str.isalnum() dalam penapis( ):
<code class="python">''.join(ch for ch in string if ch.isalnum()) filter(str.isalnum, string)</code>
Petanda aras perbandingan menunjukkan bahawa pendekatan re.sub() dengan ungkapan biasa yang disusun menghasilkan prestasi terbaik:
$ python -m timeit -s \ "import re, string; pattern = re.compile('[\W_]+')" \ "pattern.sub('', string.printable)" 100000 loops, best of 3: 11.2 usec per loop
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengeluarkan Aksara Bukan Alfanumerik dengan Cekap daripada Rentetan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!