ホームページ バックエンド開発 PHPチュートリアル PHP_PHP チュートリアルで中国語の文字列をインターセプトする方法の概要

PHP_PHP チュートリアルで中国語の文字列をインターセプトする方法の概要

Jul 21, 2016 pm 02:55 PM
php 1つ 中国語 要約する インターセプト 方法 プログラム

手順1: PHPで中国語の文字列をインターセプトする方法

WebサイトのホームページやvTigerCRMで中国語の文字列をインターセプトすると文字化け(substrを使用)が頻繁に発生するため、今日は中国語の文字列をインターセプトするより良い方法を見つけたので、ここで共有します。

クリップボードにコピーLiehuo.Net Codes引用コンテンツ: [www.bkjia.com] 関数 msubstr($str, $start, $len) {
$tmpstr = "";
$strlen = $start + $len;
for($i if(ord(substr($str, $i, 1)) > 0xa0) {
$tmpstr .= substr($str, $i, 2)
} else
$tmpstr .= substr( $str、$i、1)
$tmpstr;
手順 2: PHP は UTF-8 文字列をインターセプトし、半文字問題を解決します



クリップボードにコピー

引用コンテンツ: [www.bkjia.com] /*************************************************** * **************** Liehuo.Net Codes* PHP は、半文字の問題を解決するために UTF-8 文字列をインターセプトします。 * 英語と数字(半角)は1バイト(8ビット)、中国語(全角)は3バイト* @return $lenが0以下の場合は文字列全体を返します
* @ param $str ソース文字列
* $len 左側の部分文字列の長さ
******************************** ** *****************************/
function utf_substr($str,$len)
{
for($i=0;$i{
$temp_str=substr($str,0, 1);
if(ord($temp_str) > 127)
if($i{
$new_str($str,0,3); str=substr($str,3);
}
}
else
{
$new_str($str,0,1);
$str=substr($str,1);
return join($new_str)
}
?>


php utf-8文字列インターセプト



クリップボードにコピー

引用コンテンツ:

[www.bkjia.com]
function Cutstr($string, $length) { preg_match_all("/[x01-x7f]|[xc2-xdf][x80-xbf]|xe0[xa0-xbf][x80-xbf]|[xe1 -xef][x80-xbf][x80-xbf]|xf0[x90-xbf][x80-xbf][x80-xbf]|[xf1-xf7][x80-xbf][x80-xbf][x80-xbf] ]/", $string, $info); for($i=0; $i$wordscut .= $info[0][$i]; $j = ord($info[0][$i]) > 127 ? $j + 2 : $j + 1; Liehuo.Net Codesif ($j > $length - 3) { return $wordscut." . .."; }
}
return join('', $info[0]);
}
$string="242432 反対派は広い大使館の場所7890でコミットしています";
for($i=0; $i{
echo Cutstr($string,$i)."
"
}
?>
UTF-8 文字列のインターセプト関数

複数の言語をサポートするために、Web サイトの開発中にデータベース内の文字列が UTF-8 エンコーディングとして保存される場合、PHP を使用して文字列の一部をインターセプトする必要がある場合があります。文字化けを避けるために、次のUTF-8文字列インターセプト関数を記述します

utf-8の原理については、UTF-8 FAQを参照してください

UTF-8でエンコードされた文字は、特定の数の1〜3バイトで構成される場合があります最初のバイトから判断できます。 (理論的にはもっと長いかもしれませんが、ここでは 3 バイトを超えないと仮定します)
最初のバイトが 224 より大きい場合、それとその後の 2 バイトは UTF-8 文字を形成します

最初のバイトは より大きい192 が 224 より小さい場合、その文字とその後の 1 バイトは UTF-8 文字を形成します
それ以外の場合、最初のバイト自体は英語文字 (数字と句読点の一部を含む) になります。

Web サイト用に以前に設計されたコード (現在ホームページで使用されている長さインターセプト関数も)

クリップボードにコピーLiehuo.Net Codes引用コンテンツ: [www.bkjia.com] //$sourcestr は処理される文字列です
//$cutlength はインターセプトの長さ (つまり、単語の数)
function Cut_str($sourcestr,$cutlength)
{
$returnstr='' ;
$i=0;
$n=0;
$str_length=strlen($sourcestr);//文字列のバイト数
(($n<$cutlength) および ($i< =$str_length) )
{
$temp_str=substr($sourcestr,$i,1);
$ascnum=Ord($temp_str);//文字列内の $i 番目の文字の ASCII コードを取得します
if ($ascnum>=224 ) //ASCII ビットが 224 より大きい場合、
{
$returnstr=$returnstr.substr($sourcestr,$i,3); //UTF-8 エンコーディング仕様によると、3連続する文字は 1 文字としてカウントされます
$i=$i+3; //実際のバイトは 3 としてカウントされます
$n++; // 文字列の長さは 1 としてカウントされます
}
elseif ($ascnum>=192) //ASCII ビットが 192 より大きい場合、
{
$ returnstr=$returnstr.substr($sourcestr,$i,2); //UTF-8 エンコーディング仕様に従って、連続する 2 文字は 1 文字としてカウントされます。 Character
$i=$i+2; //実際のバイトは 2 としてカウントされます
$n++; //文字列の長さは 1 としてカウントされます
}
elseif ($ascnum>=65 && $ascnum<=90) //If大文字です
{
$returnstr=$returnstr.substr($sourcestr, $i,1); //実際のバイト数は 1 としてカウントされます
$n++; //ただし、全体の見た目を考慮して、大文字も上位ビット文字 1 文字としてカウントします
}
else //その他 この場合、小文字と半角句読点も含めて、
{
$returnstr=$returnstr.substr( $sourcestr,$i,1);
$i=$i+1; //実際のバイト数は 1
$n=$n+0.5; //小文字と半角句読点は high の半分の幅になります。 -bit 文字...
}
}
if ($str_length>$cutlength){
$returnstr = $returnstr . "... ";//長さを超える場合は末尾に省略記号を追加します
}
return $戻り値

}
インターセプト utf-8 文字列関数


Copy to ClipboardLiehuo.Net Codes引用的内容:[www.bkjia.com] function FSubstr($title,$start,$len="",$magic=true)
{

if($len == "") $len=strlen($title);

if($start != 0)
{
$startv = ord(substr($title,$start,1));
if($startv >= 128)
{
if($startv < 192)
{
for($i=$start-1;$i>0;$i--)
{
$tempv = ord(substr($title,$i,1));
if($tempv >= 192) break;
}
$start = $i;
}
}
}

if(strlen($title)<=$len) return substr($title,$start,$len);

$alen = 0;
$blen = 0;

$realnum = 0;

for($i=$start;$i{
$ctype = 0;
$cstep = 0;

$cur = substr($title,$i,1);
if($cur == "&")
{
if(substr($title,$i,4) == "<")
{
$cstep = 4;
$length += 4;
$i += 3;
$realnum ++;
if($magic)
{
$alen ++;
}
}
else if(substr($title,$i,4) == ">")
{
$cstep = 4;
$length += 4;
$i += 3;
$realnum ++;
if($magic)
{
$alen ++;
}
}
else if(substr($title,$i,5) == "&")
{
$cstep = 5;
$length += 5;
$i += 4;
$realnum ++;
if($magic)
{
$alen ++;
}
}
else if(substr($title,$i,6) == """)
{
$cstep = 6;
$length += 6;
$i += 5;
$realnum ++;
if($magic)
{
$alen ++;
}
}
else if(preg_match("/&#(\d+);?/i",substr($title,$i,8),$match))
{
$cstep = strlen($match[0]);
$length += strlen($match[0]);
$i += strlen($match[0])-1;
$realnum ++;
if($magic)
{
$blen ++;
$ctype = 1;
}
}
}else{
if(ord($cur)>=252)
{
$cstep = 6;
$length += 6;
$i += 5;
$realnum ++;
if($magic)
{
$blen ++;
$ctype = 1;
}
}elseif(ord($cur)>=248){
$cstep = 5;
$length += 5;
$i += 4;
$realnum ++;
if($magic)
{
$ctype = 1;
$blen ++;
}
}elseif(ord($cur)>=240){
$cstep = 4;
$length += 4;
$i += 3;
$realnum ++;
if($magic)
{
$blen ++;
$ctype = 1;
}
}elseif(ord($cur)>=224){
$cstep = 3;
$length += 3;
$i += 2;
$realnum ++;
if($magic)
{
$ctype = 1;
$blen ++;
}
}elseif(ord($cur)>=192){
$cstep = 2;
$length += 2;
$i += 1;
$realnum ++;
if($magic)
{
$blen ++;
$ctype = 1;
}
}elseif(ord($cur)>=128){
$length += 1;
}else{
$cstep = 1;
$length +=1;
$realnum ++;
if($magic)
{
if(ord($cur) >= 65 && ord($cur) <= 90)
{
$blen++;
}else{
$alen++;
}
}
}
}

if($magic)
{
if(($blen*2+$alen) == ($len*2)) break;
if(($blen*2+$alen) == ($len*2+1))
{
if($ctype == 1)
{
$length -= $cstep;
break;
}else{
break;
}
}
}else{
if($realnum == $len) break;
}
}

unset($cur);
unset($alen);
unset($blen);
unset($realnum);
unset($ctype);
unset($cstep);

return substr($title,$start,$length);
}

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/364371.htmlTechArticle程序一:PHP截取中文字符串方法 由于网站首页以及vTigerCRM里经常在截取中文字符串时出现乱码(使用substr),今天找到一个比较好的截取中文...
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Dec 24, 2024 pm 04:42 PM

PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

CakePHP の日付と時刻 CakePHP の日付と時刻 Sep 10, 2024 pm 05:27 PM

Cakephp4 で日付と時刻を操作するには、利用可能な FrozenTime クラスを利用します。

CakePHP について話し合う CakePHP について話し合う Sep 10, 2024 pm 05:28 PM

CakePHP は、PHP 用のオープンソース フレームワークです。これは、アプリケーションの開発、展開、保守をより簡単にすることを目的としています。 CakePHP は、強力かつ理解しやすい MVC のようなアーキテクチャに基づいています。モデル、ビュー、コントローラー

CakePHP ファイルのアップロード CakePHP ファイルのアップロード Sep 10, 2024 pm 05:27 PM

ファイルのアップロードを行うには、フォーム ヘルパーを使用します。ここではファイルアップロードの例を示します。

CakePHP バリデータの作成 CakePHP バリデータの作成 Sep 10, 2024 pm 05:26 PM

Validator は、コントローラーに次の 2 行を追加することで作成できます。

CakePHP のロギング CakePHP のロギング Sep 10, 2024 pm 05:26 PM

CakePHP へのログインは非常に簡単な作業です。使用する関数は 1 つだけです。 cronjob などのバックグラウンド プロセスのエラー、例外、ユーザー アクティビティ、ユーザーが実行したアクションをログに記録できます。 CakePHP でのデータのログ記録は簡単です。 log()関数が提供されています

PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法 PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法 Dec 20, 2024 am 11:31 AM

Visual Studio Code (VS Code とも呼ばれる) は、すべての主要なオペレーティング システムで利用できる無料のソース コード エディター (統合開発環境 (IDE)) です。 多くのプログラミング言語の拡張機能の大規模なコレクションを備えた VS Code は、

CakePHP クイックガイド CakePHP クイックガイド Sep 10, 2024 pm 05:27 PM

CakePHP はオープンソースの MVC フレームワークです。これにより、アプリケーションの開発、展開、保守がはるかに簡単になります。 CakePHP には、最も一般的なタスクの過負荷を軽減するためのライブラリが多数あります。

See all articles