[php]
/**
* 中文分词处理方法
* ---------------------------------
* @param stirng $string 要处理的字符串
* @param boolers $sort=false 根据value进行倒序
* @param Numbers $top=0 返回指定数量,默认返回全部
* ---------------------------------
* @return void
*/
函数 scws($text, $top = 5, $return_array = false, $sep = ',') {
include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
$cws = new pscws4('utf-8');
$cws-> set_charset('utf-8');
$cws-> set_dict('./pscws4/etc/dict.utf8.xdb');
$cws-> set_rule('./pscws4/etc/rules.utf8.ini');
//$cws->set_multi(3);
$cws->设置_忽略(真);
//$cws->set_debug(true);
//$cws->set_duality(true);
$cws->发送文本($文本);
$ret = $cws ->; get_tops($top, 'r,v,p');
$结果=空;
foreach($ret 作为 $value){
if (false === $return_array) {
$ 结果 .= $sep 。 $值['单词'];
}其他{
$结果[] = $值['单词'];
}
}
返回 false === $return_array ? substr($结果, 1) : $结果;
}
print_r(scws('青花夔龙纹香炉'));
/**
* 中文分词处理方法
* ---------------------------------
* @param stirng $string 要处理的字符串
* @param boolers $sort=false 根据value进行倒序
* @param Numbers $top=0 返回指定数量,默认返回全部
* ---------------------------------
* @return void
*/
函数 scws($text, $top = 5, $return_array = false, $sep = ',') {
include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
$cws = new pscws4('utf-8');
$cws-> set_charset('utf-8');
$cws-> set_dict('./pscws4/etc/dict.utf8.xdb');
$cws-> set_rule('./pscws4/etc/rules.utf8.ini');
//$cws->set_multi(3);
$cws-> set_ignore(true);
//$cws->set_debug(true);
//$cws->set_duality(true);
$cws-> send_text($text);
$ret = $cws ->; get_tops($top, 'r,v,p');
$结果 = null;
foreach ($ret 作为 $value) {
if (false === $return_array) {
$ 结果 .= $sep 。 $value['word'];
} 其他 {
$result[] = $value['word'];
}
}
返回 false === $return_array ? substr($结果, 1) : $结果;
}
print_r(scws('青花夔龙纹香炉'));