php中截取单个中文

Question

1、怎样将php中出现的中文字符一个一个截取出来，有没有不用mb_substr的方法。
2、比如我写一个统计文件中（单个文件超过100万字）中文各字符出现次数的，java中用charAt方法即可遍历字符，程序写下来也就几秒，但是在php中用mb_库十分慢，等了好几分钟都没有结果。
3、附java实现的代码 java实现统计字符出现次数

天蓬老师 · Answer

经测试，我的代码应该是没有问题的，请指正：

     $str = file_get_contents("hong.txt");
     preg_match_all("/./u", $str, $arr);
     $store = [];
     foreach($arr[0] as $value){
         if(array_key_exists($value, $store)){
             $store[$value]++;
         }else{
             $store[$value] = 1;
         }   
     }   
     asort($store);
     var_dump($store);

此段代码在php7环境下对红楼梦进行操作（148万字），总耗时0.464s。

ringa_lee · Answer

中文字符串分隔

 0) {
        if (ord(substr($tempaddtext, $cind, 1)) < 192) {
            if (substr($tempaddtext, $cind, 1) != " ") {
                array_push($arr_cont, substr($tempaddtext, $cind, 1));
            }
            $cind++;
        } elseif (ord(substr($tempaddtext, $cind, 1)) < 224) {
            array_push($arr_cont, substr($tempaddtext, $cind, 2));
            $cind += 2;
        } else {
            array_push($arr_cont, substr($tempaddtext, $cind, 3));
            $cind += 3;
        }
    }
}

print_r($arr_cont);

天蓬老师 · Answer

试试这个


其实楼上的思路也没问题，但是代码效率不太好。我这个测试了一下，貌似有的字符识别不正常，还需要完善，只是给个思路而以。

高洛峰 · Answer

这里有字符串截取、分割的终极解决方案。
点这里，点这里

用拓展理论上是最有效的方案，php代码能实现的一般都是正则来实现，在效率上是比不上拓展的。如果觉得慢回顾下算法。

php8，我來也

30分鐘學會網站佈局

尚觀Oracle入門到精通視頻教程

你的第一行UNI-APP程式碼

Flutter 從頭到應用程式啟動

兄弟連新版Linux視頻教程

AXURE 9影片教學（適用於產品經理互動產品設計UI）

零基礎PS影片教學

16天帶你入門UI視頻教程

PS技巧和切片技巧影片教學

阿裡雲環境搭建以及項目上線視頻教程

電腦網路概述－程式設計師必須掌握的基礎知識

程式設計師必備教學——HTTP協定講解

Websocket影片教學