PHPで漢字をインターセプトして文字化けを防ぐ方法を簡単に説明します

墨辰丷
リリース: 2023-03-31 14:10:02
オリジナル
1567 人が閲覧しました

PHP 関数 substr を直接使用して中国語の文字をインターセプトすると、文字化けが発生する可能性があります。主な理由は、substr が中国語の文字を半分に「認識」する可能性があることです。それでは、この問題を解決する方法を見てみましょう。

皆さんも自分のプログラムで文字列のインターセプトを頻繁に使用していると思いますが、中国語の文字列をインターセプトするときに文字化けの問題に遭遇することがよくあります。非常に面倒なので次に中国語文字列をインターセプトする際の文字化けを防ぐ方法を2つ紹介します。
まず、自分で書いた関数が便利です。
この関数を使ってインターセプトすると文字化けが起こりません。

/** 
 * 支持中文字符串截取 
 */ 
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){ 
  switch($charset){ 
    case 'utf-8':$char_len=3;break; 
    case 'UTF8':$char_len=3;break; 
    default:$char_len=2; 
  } 
  //小于指定长度,直接返回 
  if(strlen($str)<=($length*$char_len)){   
    return $str; 
  } 
  if(function_exists("mb_substr")){  
    $slice= mb_substr($str, $start, $length, $charset); 
  }else if(function_exists(&#39;iconv_substr&#39;)){ 
    $slice=iconv_substr($str,$start,$length,$charset); 
  }else{ 
    $re[&#39;utf-8&#39;]  = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/"; 
    $re[&#39;gb2312&#39;] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/"; 
    $re[&#39;gbk&#39;]  = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/"; 
    $re[&#39;big5&#39;]  = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/"; 
    preg_match_all($re[$charset], $str, $match); 
    $slice = join("",array_slice($match[0], $start, $length)); 
  } 
  if($suffix) 
    return $slice; 
  return $slice; 
}
ログイン後にコピー

2 番目は、PHP mb_substr 関数に組み込まれた関数です。

インターセプトする文字列のエンコード形式を指定します。文字化けを効果的に防ぐことができます。

説明

string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] ) 
<?php 
 function substr_unicode($str, $s, $l = null) { 
   return join("", array_slice( 
     preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $s, $l)); 
 } 
 
$str = "Büyük"; 
 $s = 0; // start from "0" (nth) char 
 $l = 3; // get "3" chars 
 echo substr($str, $s, $l) ."\n";  
 echo mb_substr($str, $s, $l) ."\n"; 
 echo substr_unicode($str, $s, $l); 
 ?>
ログイン後にコピー

概要: 上記がこの記事の全内容です。学ぶことは誰にとっても役立ちます。

関連する推奨事項:

PHP イベント メカニズムの原則

PHP 操作セッションとデータベース メソッド

#PHP WeChat インターフェイスは QR コード生成クラスを実装します

##

以上がPHPで漢字をインターセプトして文字化けを防ぐ方法を簡単に説明しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!