Mengalih keluar Aksara Bukan ASCII dalam Rentetan C# dengan cekap
Pembersihan data selalunya memerlukan mengalih keluar aksara bukan ASCII daripada rentetan. Kaedah Regex.Replace
C# menyediakan penyelesaian ringkas untuk tugas biasa ini.
Contoh:
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string outputString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
Pecahan Ungkapan Biasa:
Ungkapan biasa [^u0000-u007F]
menyasarkan dan mengalih keluar semua aksara di luar julat ASCII. Jom pecahkan:
[^...]
: Ini ialah kelas watak yang dinafikan. Ia sepadan dengan mana-mana watak bukan dalam set yang ditentukan.u0000-u007F
: Ini mentakrifkan julat aksara ASCII (kod Unikod mata 0 hingga 127).
: Pengkuantiti ini memastikan bahawa satu atau lebih aksara bukan ASCII berturut-turut dipadankan dan diganti.Menggantikan aksara yang dipadankan dengan rentetan kosong (""
) dengan berkesan mengeluarkannya daripada rentetan asal. Pendekatan ini menawarkan cara yang bersih dan cekap untuk mengendalikan penyingkiran aksara bukan ASCII dalam C#.
Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Aksara Bukan ASCII daripada Rentetan dalam C#?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!