Bagaimana untuk Mengekalkan Ruang dan Tempoh Semasa Mengalih Keluar Aksara Bukan ASCII dalam Fail Teks Python?

Linda Hamilton
Lepaskan: 2024-10-19 20:30:29
asal
504 orang telah melayarinya

How to Preserve Spaces and Periods While Removing Non-ASCII Characters in Python Text Files?

Mengendalikan Aksara Bukan ASCII, Memelihara Ruang dan Tempoh

Apabila berurusan dengan fail teks, selalunya perlu mengalih keluar aksara bukan ASCII semasa memelihara entiti tertentu seperti ruang dan noktah. Kod Python yang disediakan berjaya menapis aksara bukan ASCII tetapi secara tidak sengaja juga menghilangkan ruang dan noktah.

Untuk menangani isu ini, kami perlu mengubah suai fungsi onlyascii() untuk mengecualikan ruang dan noktah secara eksplisit daripada proses penapisan . Berikut ialah versi yang dikemas kini:

<code class="python">def onlyascii(char):
    if char == ' ' or char == '.':
        return char
    elif ord(char) < 48 or ord(char) > 127:
        return ''
    else:
        return char</code>
Salin selepas log masuk

Dalam fungsi onlyascii() yang disemak ini, kami menyemak sama ada aksara itu ialah ruang (' ') atau titik ('.') dan mengembalikannya jika ya. Pengubahsuaian ini memastikan entiti ini dikekalkan dalam rentetan yang ditapis.

Untuk menggunakan fungsi onlyascii() yang dikemas kini, kami boleh mengubah suai fungsi get_my_string() untuk menapis aksara menggunakan fungsi ini:

<code class="python">def get_my_string(file_path):
    f = open(file_path, 'r')
    data = f.read()
    f.close()
    filtered_data = filter(onlyascii, data)
    filtered_data = filtered_data.lower()
    return ''.join(filtered_data)</code>
Salin selepas log masuk

Kaedah join() digunakan untuk menggabungkan aksara daripada iterable dikembalikan oleh fungsi filter(), menghasilkan rentetan.

Dengan melaksanakan pengubahsuaian ini, anda boleh mengalih keluar aksara bukan ASCII sambil mengekalkan ruang dan noktah dalam rentetan teks anda, memenuhi keperluan projek khusus anda.

Atas ialah kandungan terperinci Bagaimana untuk Mengekalkan Ruang dan Tempoh Semasa Mengalih Keluar Aksara Bukan ASCII dalam Fail Teks Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!