Dengan pempopularan Internet dan kemajuan pengantarabangsaan, semakin ramai pengguna datang dari pelbagai negara dan wilayah, dan kadar penggunaan input aksara Cina dalam input pengguna juga telah meningkat. Pengesahan aksara Cina adalah bahagian penting untuk beberapa tapak web Cina atau tapak web antarabangsa. Bagi pembangun, amat perlu untuk memahami cara menggunakan ungkapan biasa PHP untuk mengesahkan input aksara Cina.
PHP ialah bahasa pengaturcaraan pelayan yang biasa digunakan Ia digemari oleh ramai pembangun kerana kesederhanaan, kemudahan pembelajaran, keterbukaan dan kebebasannya. Ungkapan biasa ialah alat yang berkuasa untuk memproses teks Ia sangat mudah alih dan boleh digunakan dalam bahasa pengaturcaraan yang berbeza. Oleh itu, adalah sangat praktikal untuk mengesahkan input aksara Cina melalui ungkapan biasa PHP.
Seterusnya, saya akan memperkenalkan cara menggunakan ungkapan biasa PHP untuk mengesahkan input aksara Cina, dan cara menangani beberapa situasi khas yang mungkin berlaku dalam input aksara Cina.
Dalam PHP, gunakan fungsi preg_match() untuk memadankan format sintaks adalah seperti berikut:
preg_match( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]]): int|false
Antaranya, $pattern ialah corak ungkapan biasa yang akan dipadankan, $subject ialah rentetan yang akan dipadankan, dan $matches digunakan untuk menyimpan hasil padanan. Jika perlawanan berjaya, 1 dikembalikan, jika tidak 0 dikembalikan.
Untuk pengesahan input aksara Cina, kita boleh menggunakan ungkapan biasa berikut:
$pattern = '/^[u4e00-u9fa5]+$/u';
Maksud ungkapan biasa ini adalah untuk memadankan rentetan yang bermula dan berakhir dengan aksara Cina. [u4e00-u9fa5]
ialah julat aksara Cina dalam pengekodan Unikod dan u
menunjukkan pengekodan UTF-8.
Seterusnya, gunakan fungsi preg_match() untuk mengesahkan:
if (preg_match($pattern, $input)) { echo "验证成功!"; } else { echo "验证失败!"; }
di mana $input ialah rentetan yang akan disahkan. Jika pengesahan berjaya, keluarkan "Pengesahan berjaya!" jika tidak, keluarkan "Pengesahan gagal!";
Untuk beberapa situasi khas, ungkapan biasa di atas mungkin perlu dilaraskan.
Dalam sesetengah kes, input aksara Cina mungkin menggunakan aksara lebar penuh dan bukannya aksara separuh lebar. Oleh itu, ungkapan biasa perlu dipertingkatkan:
$pattern = '/^[x{3000}-x{303F}x{4e00}-x{9fa5}x{FF00}-x{FFEF}]+$/u';
Antaranya, x{3000}-x{303F}
bermaksud memadankan simbol lebar penuh dan x{FF00}-x{FFEF}
bermaksud memadankan simbol Cina dan Inggeris lebar penuh.
Dalam input beberapa aksara Cina, beberapa simbol khas mungkin muncul, seperti aksara langka, radikal Cina, dsb. Untuk dapat memadankan aksara Cina ini, set aksara Unicode perlu digunakan.
$pattern = "/^[x{4e00}-x{9fa5}x{3400}-x{4DBF}x{20000}-x{2A6DF}x{2A700}-x{2B73F}x{2B740}-x{2B81F}x{2B820}-x{2CEAF}x{2CEB0}-x{2EBEF}x{2F800}-x{2FA1F}]+$/u";
Antaranya, x{3400}-x{4DBF}
sepadan CJK sambungan A, x{20000}-x{2A6DF}
sepadan CJK sambungan B, x{2A700}-x{2B73F}
sepadan CJK sambungan C, x{2B740}-x{2B81F}
sepadan CJK sambungan D, x{2B820}-x{2CEAF}
sepadan CJK sambungan E, x{2CEB0}-x{2EBEF}
sepadan dengan sambungan CJK F, x{2F800}-x{2FA1F}
sepadan dengan sambungan serasi CJK.
Dalam sesetengah kes, input aksara Cina mungkin mengandungi ruang, baris baharu, tab dan aksara aksara ruang kosong yang lain. Pada masa ini, anda perlu menambah pernyataan yang sepadan dengan aksara ruang putih dengan ungkapan biasa.
$pattern = '/^[\s\S]*|^[x{4e00}-x{9fa5}x{3400}-x{4DBF}x{20000}-x{2A6DF}x{2A700}-x{2B73F}x{2B740}-x{2B81F}x{2B820}-x{2CEAF}x{2CEB0}-x{2EBEF}x{2F800}-x{2FA1F}]+$/u';
Antaranya, [sS]*
sepadan dengan mana-mana aksara kosong |
bermaksud atau;
Dengan mengendalikan situasi istimewa ini, input aksara Cina boleh disahkan dengan lebih menyeluruh.
Menggunakan ungkapan biasa PHP untuk mengesahkan input aksara Cina ialah kemahiran yang sangat praktikal. Melalui ungkapan biasa yang sesuai, input aksara Cina boleh disahkan dengan berkesan. Pada masa yang sama, pelarasan yang sesuai kepada ungkapan biasa berdasarkan keadaan sebenar dapat memenuhi keperluan sebenar dengan lebih baik. Oleh itu, amat perlu bagi pembangun untuk menguasai kaedah mengesahkan input aksara Cina menggunakan ungkapan biasa PHP, dan ia juga merupakan sebahagian daripada kemahiran pengaturcaraan.
Atas ialah kandungan terperinci Bagaimana untuk mengesahkan input aksara Cina menggunakan ungkapan biasa PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!