ホームページ > php教程 > php手册 > 分享一个PHP中文分词

分享一个PHP中文分词

WBOY
リリース: 2016-06-13 09:43:06
オリジナル
1054 人が閲覧しました


 

  1.   
  2. /** 
  3.  * 中文分词处理方法 
  4.  *+--------------------------------- 
  5.  * @param stirng  $string 要处理的字符串 
  6.  * @param boolers $sort=false 根据value进行倒序 
  7.  * @param Numbers $top=0 返回指定数量,默认返回全部 
  8.  *+--------------------------------- 
  9.  * @return void 
  10.  */  
  11. function scws($text, $top = 5, $return_array = false, $sep = ',') {  
  12.     include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来  
  13.     $cws = new pscws4('utf-8');  
  14.     $cws -> set_charset('utf-8');  
  15.     $cws -> set_dict('./pscws4/etc/dict.utf8.xdb');  
  16.     $cws -> set_rule('./pscws4/etc/rules.utf8.ini');  
  17.     //$cws->set_multi(3);  
  18.     $cws -> set_ignore(true);  
  19.     //$cws->set_debug(true);  
  20.     //$cws->set_duality(true);  
  21.     $cws -> send_text($text);  
  22.     $ret = $cws -> get_tops($top, 'r,v,p');  
  23.     $result = null;  
  24.     foreach ($ret as $value) {  
  25.         if (false === $return_array) {  
  26.             $result .= $sep . $value['word'];  
  27.         } else {  
  28.             $result[] = $value['word'];  
  29.         }  
  30.     }  
  31.     return false === $return_array ? substr($result, 1) : $result;  
  32. }  
  33. print_r(scws('青花夔龙纹香炉'));  
  34.  

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート