strlen と mb_strlen の違い、strlenmb_strlen_PHP チュートリアル
Jul 13, 2016 am 10:19 AMstrlenとmb_strlen、strlenmb_strlenの違い
phpで文字列の長さを計算する一般的な関数は、strlenとmb_strlenです。文字がすべて英語の場合、この2つは同じです。ここでは主に中国語と英語が混在した場合の 2 つの計算結果を比較します。
PHPでは、strlenとmb_strlenは文字列の長さを求める関数ですが、初心者の方にとってはマニュアルを読まないと違いがよくわからない方もいるかもしれません。 以下は 2 つの違いを説明する例です。
- <?php
- //テスト時のファイルのエンコード方式はUTF8である必要があります
- $str='漢字a' ;
- エコー strlen($str).'<br>';//14
- echo mb_strlen($str,'utf8').'<br>';//6
- echo mb_strlen($str,'gbk').'<br>';//8
- echo mb_strlen($str,'gb2312').'<br>';//10
?>- 結果分析: strlen を計算するとき、UTF8 の中国語の文字は 3 つの長さとして扱われるため、「中国語の 1 文字の文字」の長さは 3*4+2=14 になります。mb_strlen を計算するとき、選択された内部コードは UTF8 です。すると、漢字は1文字の長さとして計算されるので、「漢字1文字1文字」の長さは6になります
- echo (strlen($str) + mb_strlen($str,'UTF8')) / 2; 例えば、「中国語一文字1文字」のstrlen($str)値が14、mb_strlen($str)値が6である場合、「中国語一文字1文字」のプレースホルダは次のように計算できます。 10.
- mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。 mb_strlen は PHP のコア関数ではないことに注意してください。これを使用する前に、php_mbstring.dll が php.ini にロードされていることを確認する必要があります。つまり、「extension=php_mbstring.dll」という行が含まれていることを確認してください。存在し、コメントアウトされていない場合は、関数の定義に関するエラー メッセージが表示されます。
phpにおけるstrlenとmb_strlenとcountの違い
の関数は何ですか?
PHPでは、strlenとmb_strlenは文字列の長さを調べる関数ですが、初心者にとってはマニュアルを読まないと違いがよくわからない人もいるかもしれません。
以下は 2 つの違いを説明する例です。
まず例を見てください:
<?php //テスト中のファイルのエンコード方式はUTF8である必要があります $str='中国語1文字'; echo strlen($str).'<br>'; //14 echo mb_strlen ($str,'utf8').'<br>';//6 echo mb_strlen($str,'gbk').'<br>';//8 echo mb_strlen($str ,'gb2312') .'<br>';//10 ?>
結果分析: strlen を計算するとき、UTF8 の中国語文字は 3 つの長さとして扱われるため、「中国語の 1 文字」の長さは次のようになります。 3*4+2 =14、mb_strlen を計算するとき、内部コードが UTF8 に選択されている場合、中国語の文字は長さ 1 として計算されるため、「中国語の文字 1 文字」の長さは 6 になります。
使用一緒に計算するこれら 2 つの関数 中国語と英語の混合文字列のプレースホルダーは何ですか (中国語の文字のプレースホルダーは 2、英語の文字のプレースホルダーは 1)
echo (strlen($str) + mb_strlen( $str,'UTF8')) / 2 ;
たとえば、「中国語 1 文字 1 文字」の strlen($str) の値が 14、mb_strlen($str) の値が 6 であれば計算できます。 「中国語の 1 文字 1 文字」のプレースホルダーは 10 です。
echo mb_internal_encoding();
PHP の組み込みの文字列長関数 strlen は、文字列が占有するバイト数を取得するだけです。 GB2312 中国語エンコードの場合、strlen によって取得される値は中国語の文字数の 2 倍ですが、UTF-8 エンコードされた中国語の場合、その差は 3 倍になります (UTF-8 エンコードでは、1 つの中国語文字は 3 バイトを占めます)。
mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。
mb_strlen は PHP のコア関数ではないことに注意してください。これを使用する前に、php_mbstring.dll が php.ini にロードされていることを確認する必要があります。つまり、「extension=php_mbstring.dll」という行が含まれていることを確認してください。存在し、コメントアウトされていない場合は、関数の定義に関するエラー メッセージが表示されます。

人気の記事

人気の記事

ホットな記事タグ

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











LaravelのバックエンドでReactアプリを構築する:パート2、React
