Penapisan Watak Cekap dalam Rentetan
Artikel ini menangani tugas mengalih keluar aksara khas secara cekap daripada rentetan, memastikan ia mengandungi aksara abjad angka sahaja, garis bawah dan titik.
Kod yang disediakan menyemak kaedah menggunakan gelung untuk pengesahan aksara, walaupun ia mungkin bukan pendekatan yang paling berkesan. Pengoptimuman yang dicadangkan melibatkan penggunaan enumerator dan memulakan StringBuilder dengan kapasiti yang dijangkakan untuk mengurangkan akses tatasusunan.
Untuk pilihan cekap более, ungkapan biasa boleh digunakan, tetapi prestasi mungkin terjejas untuk rentetan pendek. Ungkapan biasa berikut akan berjaya memadankan aksara yang dibenarkan:
[0-9A-Za-z._]+
Walau bagaimanapun, jadual carian mengatasi kedua-dua manipulasi rentetan dan ungkapan biasa dalam senario ini. Jadual carian menyimpan nilai Boolean yang menunjukkan sama ada setiap aksara dibenarkan, mempercepatkan proses penapisan dengan ketara.
Penyelesaian lengkap yang menggabungkan jadual carian:
private static bool[] _lookup; static Program() { _lookup = new bool[65536]; for (char c = '0'; c <= '9'; c++) _lookup[c] = true; for (char c = 'A'; c <= 'Z'; c++) _lookup[c] = true; for (char c = 'a'; c <= 'z'; c++) _lookup[c] = true; _lookup['.'] = true; _lookup['_'] = true; } public static string RemoveSpecialCharacters(string str) { char[] buffer = new char[str.Length]; int index = 0; foreach (char c in str) { if (_lookup[c]) { buffer[index] = c; index++; } } return new string(buffer, 0, index); }
Ujian prestasi menunjukkan bahawa jadual carian pendekatan adalah jauh lebih pantas daripada kaedah gelung atau ungkapan biasa, dengan masa pelaksanaan kira-kira 13 milisaat untuk Rentetan 24 aksara.
Atas ialah kandungan terperinci Apakah Cara Paling Cekap untuk Menapis Watak Khas daripada Rentetan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!