ホームページ > バックエンド開発 > PHPチュートリアル > PHP: 漢字を unicode に変換するためのユニバーサル関数_PHP チュートリアル

PHP: 漢字を unicode に変換するためのユニバーサル関数_PHP チュートリアル

WBOY
リリース: 2016-07-21 14:52:52
オリジナル
779 人が閲覧しました

中国語の文字を Unicode に変換するユニバーサル関数。ライブラリや他のカスタム関数には依存しませんが、条件があります。このファイルと関数の入力パラメーターは UTF-8 でエンコードされる必要があり、そうでない場合は関数変換が行われます。が必要です。

/**
* 中国語の文字を Unicode に変換するユニバーサル関数です。ライブラリや他のカスタム関数には依存しませんが、条件があります。
* 条件: このファイルと関数の入力パラメーターは utf-8 でエンコードされる必要があります。そうでない場合は関数変換が必要です
* 実際、漢字に限らず、逆変換関数は簡単に作成できます。なぜ PHP には既製の関数がないのでしょう
* @author xeyeye
*
* @ param {string} $word は中国語の文字であるか、中国語の文字を表す必要があります 配列 (str_split で切り取られます)
* @return {string} 中国語の文字「you」を表す 4f60 などの 10 進数の Unicode コード
*/
function getUnicodeFromOneUTF8($word) {
//文字の内部配列表現を取得するため、このファイルは utf-8 でエンコードされる必要があります。
if (is_array( $word))
$arr = $word;
else
$arr = str_split($word);
//このとき、$arr は array(228, 189, 160) のようになります
//定義 空の文字列が格納されます
$bin_str = ''; //数値に変換し、次にバイナリ文字列に変換し、最後にそれらを結合します。
foreach ($arr as $value)
$bin_str .= decbin(ord($value));
//このとき、$bin_str は、漢字の「you」の場合、111001001011110110100000 のようになります
//通常のインターセプト
$bin_str = preg_replace('/^.{4}(.{4}).{2}(.{6}).{2}(.{6})$/','$1$2$3' , $bin_str);
// このとき、$bin_str は、漢字の「you」の場合、0100111101100000 に似ています。
return binding($bin_str) // Return は、漢字の「you」の 20320 に似ています。 "
//return dechex(bindec($bin_str)); // 16 進数の 4f60 を返したい場合は、この文を使用します
}
?>

http://www.bkjia.com/PHPjc/371491.htmlwww.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/371491.html技術記事中国語の文字を Unicode に変換するユニバーサル関数です。ライブラリや他のカスタム関数には依存しませんが、条件があります。このファイルと関数の入力パラメータは utf-8 でエンコードされている必要があります。それ以外の場合は、追加する必要があります。 ...
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート