Dalam pembangunan web, aksara Cina sering digunakan sebagai tag, tajuk, teks kandungan, dsb. Walau bagaimanapun, dalam beberapa senario aplikasi, adalah perlu untuk menukar aksara Cina kepada kod perpuluhan untuk pengiraan berangka, penyimpanan data dan operasi lain. Artikel ini akan memperkenalkan cara menggunakan bahasa PHP untuk menukar aksara Cina kepada kod perpuluhan.
1. Konsep pengekodan aksara Cina
Pengekodan aksara Cina merujuk kepada proses pemetaan aksara Cina kepada nilai binari yang boleh dikenali oleh komputer. Aksara Cina boleh diwakili oleh pelbagai kaedah pengekodan Kaedah pengekodan yang paling biasa ialah Unicode, GBK, GB2312, dsb. Kaedah pengekodan ini memetakan aksara Cina kepada nilai heksadesimal.
Sebagai contoh, nilai perenambelasan perkataan "中" dalam pengekodan Unikod ialah "4E2D", dan nilai perenambelasan dalam pengekodan GBK ialah "D6D0".
2. Kaedah menukar aksara Cina kepada kod perpuluhan
Fungsi PHP ord() boleh mengembalikan aksara tertentu Nilai kod ASCLL. Oleh kerana nilai kod ASCLL ialah integer dari 0 hingga 255, aksara Cina boleh ditukar kepada nilai kod ASCLL, dan kemudian nilai kod ASCLL boleh ditukar kepada format dan output perpuluhan.
Kod sampel:
<?php $str = '中'; echo ord($str); ?>
Hasil berjalan:
20013
Nota: Kaedah ini hanya terpakai apabila aksara Cina mempunyai nilai yang sepadan dalam jadual kod ASCLL.
Pustaka sambungan PHP mbstring menyediakan fungsi mb_convert_encoding() yang boleh menukar antara pelbagai kaedah pengekodan. Dengan menukar aksara Cina kepada pengekodan UTF-8, kemudian gunakan fungsi unpack() untuk menukar rentetan yang dikodkan UTF-8 kepada kod ASCII, dan akhirnya menggunakan fungsi implode() untuk menggabungkan rentetan menjadi integer.
Kod sampel:
<?php function chinese_encode($str){ $utf8_str = mb_convert_encoding($str, 'UTF-8', 'auto'); $ascii_str = unpack('C*', $utf8_str); return implode('', $ascii_str); } $str = '中'; echo chinese_encode($str); ?>
Hasil jalankan:
20013
Gunakan fungsi tersuai untuk menukar aksara Cina mengikut setiap Pengekodan Unikod bagi setiap aksara Cina ditukar, dan akhirnya semua pengekodan Unikod disambungkan menjadi output integer.
Kod contoh:
<?php function chinese_encode($str){ $code = ''; for($i=0; $i<mb_strlen($str, 'UTF-8'); $i++){ $code .= dechex(ord(mb_substr($str, $i, 1, 'UTF-8'))); } return hexdec($code); } $str = '中'; echo chinese_encode($str); ?>
Hasil jalankan:
20013
3 Ringkasan
Artikel ini memperkenalkan tiga kaedah menukar aksara Cina kepada kod perpuluhan. Fungsi PHP ord(), pustaka sambungan PHP mbstring dan fungsi tersuai digunakan. Dalam aplikasi praktikal, anda boleh memilih kaedah yang sesuai dengan anda mengikut situasi tertentu. Operasi menukar aksara Cina kepada kod perpuluhan boleh melengkapkan beberapa pengiraan digital, penyimpanan data dan operasi lain dengan mudah.
Atas ialah kandungan terperinci PHP aksara Cina kepada kod perpuluhan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!