PHPでは、strlenとmb_strlenは文字列の長さを求める関数ですが、初心者の方にとってはマニュアルを読まないと違いがよく分からない方もいるかもしれません。
以下は 2 つの違いを説明する例です。
最初に例を見てください:
<ol class="dp-c"> <li class="alt"><span><span><?php </span></span></li><li><span class="comment">//测试时文件的编码方式要是UTF8 </span><span> </span></li><li class="alt"><span class="vars">$str</span><span>=</span><span class="string">'中文a字1符'</span><span>; </span></li><li><span class="func">echo</span><span> </span><span class="func">strlen</span><span>(</span><span class="vars">$str</span><span>).</span><span class="string">'<br>'</span><span>;</span><span class="comment">//14 </span><span> </span></span></li> <li class="alt"> <span class="func">echo</span><span> mb_strlen(</span><span class="vars">$str</span><span>,</span><span class="string">'utf8'</span><span>).</span><span class="string">'<br>'</span><span>;</span><span class="comment">//6 </span><span> </span> </li> <li> <span class="func">echo</span><span> mb_strlen(</span><span class="vars">$str</span><span>,</span><span class="string">'gbk'</span><span>).</span><span class="string">'<br>'</span><span>;</span><span class="comment">//8 </span><span> </span> </li> <li class="alt"> <span class="func">echo</span><span> mb_strlen(</span><span class="vars">$str</span><span>,</span><span class="string">'gb2312'</span><span>).</span><span class="string">'<br>'</span><span>;</span><span class="comment">//10 </span><span> </span> </li> <li><span>?> </span></li> </ol>
結果分析: strlen を計算するとき、UTF8 の中国語文字は 3 つの長さとして扱われるため、「中国語の 1 文字の文字」の長さは 3*4+2=14 になります。 in mb_strlen 計算する際、内部コードがUTF8を選択している場合、中国語の文字は長さ1として計算されるため、「中国語の文字1文字」の長さは6になります。
この2つの関数を使用すると、次のことができます。中国語と英語の文字を共同計算します 混合文字列のプレースホルダーは何ですか (中国語文字のプレースホルダーは 2、英語文字のプレースホルダーは 1)
<ol class="dp-c"><li class="alt"><span><span class="func">echo</span><span> (</span><span class="func">strlen</span><span>(</span><span class="vars">$str</span><span>) + mb_strlen(</span><span class="vars">$str</span><span>,</span><span class="string">'UTF8'</span><span>)) / 2; </span></span></li></ol>
たとえば、 strlen($str ) 「中国語 1 文字 1 文字」の値は 14、mb_strlen ($str) の値は 6 なので、「中国語 1 文字 1 文字」のプレースホルダーは 10 であると計算できます。
<ol class="dp-c"><li class="alt"><span><span class="func">echo</span><span> mb_internal_encoding(); </span></span></li></ol>
PHP がビルドしました-in 文字列長関数 strlen は中国語の文字列を正しく処理できません。文字列が占有するバイト数だけを取得します。 GB2312 中国語エンコードの場合、strlen によって取得される値は中国語の文字数の 2 倍ですが、UTF-8 エンコードされた中国語の場合、その差は 3 倍になります (UTF-8 エンコードでは、1 つの中国語文字は 3 バイトを占めます)。
mb_strlen 関数を使用すると、この問題をより適切に解決できます。 mb_strlen の使用法は strlen と似ていますが、文字エンコーディングを指定する 2 番目のオプションのパラメーターがある点が異なります。たとえば、UTF-8 文字列 $str の長さを取得するには、mb_strlen($str,'UTF-8') を使用できます。 2 番目のパラメータを省略した場合は、PHP の内部エンコーディングが使用されます。内部エンコーディングは、mb_internal_encoding() 関数を通じて取得できます。
mb_strlen は PHP のコア関数ではないことに注意してください。これを使用する前に、php_mbstring.dll が php.ini にロードされていることを確認する必要があります。つまり、「extension=php_mbstring.dll」という行が含まれていることを確認してください。 " が存在し、コメントアウトされていない場合は、「未定義の関数の問題」が表示されます。