PHP兑现中文字符的无乱码截断
PHP实现中文字符的无乱码截断
PHP内置的substr()函数不能对中文字符进行很好的截断处理,对于一些中英文混合的字符会出现乱码的情况。下面提供两种解决函数。
?
1、GB2312编码方式的截断
?
function msubstr($str, $start, $len) { if (strlen($str)-$start 0xa0) { //0xa0 表示中文汉字编码的第一个编码字符ASCII 码值都大于0xa0 $tmpstr .= substr($str, $i, 2); $i++; } else $tmpstr .= substr($str, $i, 1); } return $tmpstr . "...";}
?
2、utf8格式下的中文字符截断
?
UTF-8编码的字符可能由1~3个字节组成, 具体数目可以由第一个字节判断出来。(理论上可能更长,但这里假设不超过3个字节)
第一个字节大于224的,它与它之后的2个字节一起组成一个UTF-8字符
第一个字节大于192小于224的,它与它之后的1个字节组成一个UTF-8字符
否则第一个字节本身就是一个英文字符(包括数字和一小部分标点符号)。
?
//$sourcestr 是要处理的字符串//$cutlength 为截取的长度(即字数)function cut_str($sourcestr,$cutlength){ $returnstr=''; $i=0; $n=0; $str_length=strlen($sourcestr);//字符串的字节数 while (($n=224) //如果ASCII位高与224, { $returnstr=$returnstr.substr($sourcestr,$i,3); //根据UTF-8编码规范,将3个连续的字符计为单个字符 $i=$i+3; //实际Byte计为3 $n++; //字串长度计1 } elseif ($ascnum>=192) //如果ASCII位高与192, { $returnstr=$returnstr.substr($sourcestr,$i,2); //根据UTF-8编码规范,将2个连续的字符计为单个字符 $i=$i+2; //实际Byte计为2 $n++; //字串长度计1 } elseif ($ascnum>=65 && $ascnum$cutlength){ $returnstr = $returnstr . "...";//超过长度时在尾处加上省略号 } return $returnstr;}
?
?
?

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、PHP が返す文字列の最初の文字の ASCII 値について詳しく説明します。編集者が非常に実用的であると考えたので、参考として共有します。この記事を読んで何かを得ることができれば幸いです。 PHP は文字列の最初の文字の ASCII 値を返します はじめに PHP では、文字列の最初の文字の ASCII 値を取得することは、文字列処理と文字エンコーディングの基本的な知識を必要とする一般的な操作です。 ASCII 値は、コンピュータ システムで文字の数値を表すために使用され、文字の比較、データの送信、および保存に重要です。文字列の最初の文字の ASCII 値を取得するプロセスには、次の手順が含まれます。 文字列の取得: ASCII 値を取得する文字列を決定します。変数または文字列定数を指定できます

この記事では、PHP がどのようにして、別の文字列内の文字列の開始位置から終了位置まで文字列を返すかを詳しく説明します。非常に実用的であると編集者が考えたので、参考として共有します。この記事. この記事から何かを得ることができます。 PHP で substr() 関数を使用して、文字列から部分文字列を抽出します。substr() 関数は、文字列から指定された範囲内の文字を抽出できます。構文は次のとおりです。 substr(string,start,length) ここで、 string: 部分文字列が抽出される元の文字列。 start: 部分文字列の開始位置のインデックス (0 から始まります)。 length (オプション): 部分文字列の長さ。指定されていない場合は、

1 Unicode コンピュータ ストレージの基本単位は 8 ビットで構成されるバイトです。英語は 26 文字といくつかの記号のみで構成されているため、英語の文字はバイト単位で直接格納できます。ただし、他の言語 (中国語、日本語、韓国語など) では、文字数が多いため、エンコードに複数のバイトを使用する必要があります。コンピューター技術の普及に伴い、非ラテン文字エンコード技術は発展を続けていますが、依然として 2 つの大きな制限があります。 多言語サポートがないこと。 ある言語のエンコード スキームを別の言語で使用することはできません。また、統一された標準もありません。たとえば、中国語には GBK、GB2312、GB18030 など、多くのエンコード標準があります。エンコード方式が統一されていないため、開発者は異なるエンコード間で相互に変換する必要があり、必然的に多くのエラーが発生します。

__str__ と __repr__ の類似点と相違点は何ですか? 文字列の表現については誰もが知っています。Python の組み込み関数 repr() は、識別を容易にするためにオブジェクトを文字列の形式で表現できます。これが「文字列表現」です。 repr() は、特別なメソッド __repr__ を通じてオブジェクトの文字列表現を取得します。 __repr__ が実装されていない場合、ベクトルのインスタンスをコンソールに出力すると、結果の文字列が次のようになります。 >>>classExample:pass>>>print(str(Example()))>>>

文字列をインターセプトするための PHP の substr() 関数について理解します。PHP 言語では、substr() 関数は非常に便利な文字列処理関数です。指定された位置と長さで文字列の断片をインターセプトするために使用できます。 substr() 関数は、インターセプトする文字列、インターセプトの開始位置、およびインターセプトの長さの 3 つのパラメーターを受け入れます。以下では、substr() 関数の使い方を詳しく紹介し、具体的なコード例を示します。 substr() 関数の基本的な使い方 substr() 関数

PHP 関数 "substr" を使用して、文字列の部分文字列を取得します。PHP プログラミングでは、文字列の内容の一部を取得する必要がある状況によく遭遇します。このとき、PHP の組み込み関数「substr」を使用してこれを実現できます。この記事では、「substr」関数を使用して文字列の部分文字列を取得する方法を説明し、いくつかのコード例を示します。 1. substr 関数の基本的な使い方 substr 関数は、文字列から指定した長さの部分文字列を取得するために使用します。その基本的な構文は次のとおりです。

無効な PHPmb_substr 関数の解決策 PHP アプリケーションを開発する場合、文字列をインターセプトするために mb_substr 関数がよく使用されます。ただし、主にさまざまな環境での文字エンコーディングの問題が原因で、mb_substr 関数が無効になる状況が発生することがあります。この問題を解決するには、mb_substr 関数を効果的に処理する必要があります。一般的な解決策は、mb_substr 関数が次のことを実行できるようにすることです。

この記事では、PHP で文字列の先頭文字を小文字に変換する仕組みを詳しく説明しますが、非常に実践的だと思いますので、参考として共有します。 PHP 文字列の最初の文字を小文字に変換する はじめに PHP では、文字列の最初の文字を小文字に変換するのが一般的な操作です。これは、組み込み関数 lcfirst() または文字列演算子 strto lower() を使用して実現できます。このガイドでは両方のアプローチについて詳しく説明し、コード例とベスト プラクティスを示します。方法 1: lcfirst() 関数を使用する lcfirst() 関数は、文字列の最初の文字を小文字に変換し、残りの文字を変更しないように特別に設計されています。その構文は次のとおりです。

function utf8( $a, $s = '' )
{
preg_match_all( '/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/', $a, $d, PREG_PATTERN_ORDER );
return join( $s, $d[0] );
}
utf8( substr( '截取我', 0, 1 ) );
utf8( substr( '截取我', 0, 1 ) );
高手,学习学习,哈哈