Mengendalikan Aksara Bukan ASCII, Memelihara Ruang dan Tempoh
Apabila berurusan dengan fail teks, selalunya perlu mengalih keluar aksara bukan ASCII semasa memelihara entiti tertentu seperti ruang dan noktah. Kod Python yang disediakan berjaya menapis aksara bukan ASCII tetapi secara tidak sengaja juga menghilangkan ruang dan noktah.
Untuk menangani isu ini, kami perlu mengubah suai fungsi onlyascii() untuk mengecualikan ruang dan noktah secara eksplisit daripada proses penapisan . Berikut ialah versi yang dikemas kini:
<code class="python">def onlyascii(char): if char == ' ' or char == '.': return char elif ord(char) < 48 or ord(char) > 127: return '' else: return char</code>
Dalam fungsi onlyascii() yang disemak ini, kami menyemak sama ada aksara itu ialah ruang (' ') atau titik ('.') dan mengembalikannya jika ya. Pengubahsuaian ini memastikan entiti ini dikekalkan dalam rentetan yang ditapis.
Untuk menggunakan fungsi onlyascii() yang dikemas kini, kami boleh mengubah suai fungsi get_my_string() untuk menapis aksara menggunakan fungsi ini:
<code class="python">def get_my_string(file_path): f = open(file_path, 'r') data = f.read() f.close() filtered_data = filter(onlyascii, data) filtered_data = filtered_data.lower() return ''.join(filtered_data)</code>
Kaedah join() digunakan untuk menggabungkan aksara daripada iterable dikembalikan oleh fungsi filter(), menghasilkan rentetan.
Dengan melaksanakan pengubahsuaian ini, anda boleh mengalih keluar aksara bukan ASCII sambil mengekalkan ruang dan noktah dalam rentetan teks anda, memenuhi keperluan projek khusus anda.
Atas ialah kandungan terperinci Bagaimana untuk Mengekalkan Ruang dan Tempoh Semasa Mengalih Keluar Aksara Bukan ASCII dalam Fail Teks Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!