Menormalkan Input Teks kepada ASCII: Satu Cara Ke Hadapan dalam Python
Apabila membina alat pemprosesan teks, pengendalian aksara bukan ASCII boleh menjadi perkara penting cabaran. Sebagai contoh, petikan kerinting menunjukkan sumber percanggahan yang biasa. Pertukaran aksara ini dengan rakan sejawat ASCII standard mereka ialah langkah penting ke arah normalisasi data untuk analisis teks yang dipertingkatkan.
Dalam pustaka standard Python, fungsi string.Map muncul sebagai penyelesaian yang berkuasa untuk penggantian aksara. Tidak seperti fungsi 'ToAscii' generik, Map menawarkan pendekatan yang boleh disesuaikan, membolehkan pengguna mentakrifkan fungsi pemetaan tersuai yang menukar rune kepada persamaan ASCII yang diingini.
Untuk menunjukkan pendekatan ini, mari pertimbangkan sampel teks yang mengandungi kedua-dua kerinting dan petikan lurus:
data = "Hello “Frank” or ‹François› as you like to be ‘called’"
Menggunakan rentetan.Fungsi Peta, kita boleh mentakrifkan fungsi pemetaan tersuai, normalize, yang menggantikan petikan kerinting dengan rakan ASCII mereka:
<code class="python">func normalize(in rune) rune { switch in { case '“', '‹', '”', '›': return '"' case '‘', '’': return '\'' } return in }</code>
Menggunakan ini fungsi kepada data input menghasilkan teks yang dinormalkan:
cleanedData := strings.Map(normalize, data) fmt.Printf("Cleaned: %s\n", cleanedData)
Output:
Cleaned: Hello "Frank" or "François" as you like to be 'called'
Dengan menggunakan rentetan.Fungsi peta dan fungsi pemetaan tersuai, kami telah menormalkan input teks dengan berkesan, menggantikan aksara bukan ASCII dengan persamaan ASCII mereka. Pendekatan ini memastikan keserasian dengan aplikasi hiliran yang memerlukan pemformatan teks piawai.
Atas ialah kandungan terperinci Bagaimana untuk Menormalkan Input Teks kepada ASCII dalam Python Menggunakan rentetan. Fungsi Peta?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!