Thinkphp3.2 は scws 中国語単語セグメンテーションを使用してキーワードを抽出します、_PHP チュートリアル

PHP中文网
リリース: 2016-07-12 09:06:51
オリジナル
1168 人が閲覧しました

Thinkphp3.2はscws中国語単語分割を使用してキーワードを抽出します。

SCWSはSimple Chinese Word Segmentation (すなわち、Simple Chinese Word Segmentation System)の略称です。
1. scws が公式に提供するクラスをダウンロードします (ここでは pscws の第 4 バージョンを使用します)
http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2
XDB 辞書ファイルをダウンロードします (使用されています)これは utf8 簡体字中国語辞書パッケージです)
http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
2. scws クラス Pscws.class.php を解凍します (ここではput pscws4 .class.php ファイル名は pscws.class.php に変更されました) と XDB_R.class.php (ここでは xdb_r.class.php ファイル名を大文字の XDB_R.class.php に変更しました) を以下に配置しますThinkPHPLibraryOrgUtil ディレクトリ。
3. 次に、Pscws.class.phpを変更します
名前空間を追加します

1 namespace Org\Util;
ログイン後にコピー

クラスの名前をPscws

把require_once (dirname(__FILE__) . '/XBD_R.class.php');这段代码删除掉。
ログイン後にコピー
に変更します

XDB_R.class.phpを変更します
名前空間を追加します

namespace Org\Util;
ログイン後にコピー

4. Publicadmin ディレクトリ 新しい dict フォルダを作成し、XDB 辞書ファイルの dict.utf8.xdb を word ディレクトリに抽出し、このディレクトリの scws クラスの etc の下に rules.utf8.ini を配置します。
5. 定数定義コードの行をエントリ ファイルに追加します (実際には辞書ファイルと構成ファイルを定義するパス)

define("CONF_PATH", dirname(__FILE__)."/Public/admin/dict/");
ログイン後にコピー

6. 他のメソッドを呼び出すためのプライベート メソッドを IndexController.class.php コントローラーに作成します。
/**
     * 中文分词  
         * @params string $title 需要分词的语句 
         * @params int $num  分词个数,默认不用填写
     **/
    private function get_tags($title,$num=null){        
        $pscws = new \Org\Util\Pscws('utf8');
        $pscws->set_dict(CONF_PATH . 'dict.utf8.xdb');
        $pscws->set_rule(CONF_PATH . 'rules.utf8.ini');
        $pscws->set_ignore(true);
        $pscws->send_text($title);
        $words = $pscws->get_tops($num);
        $pscws->close();
        $tags = array();
        foreach ($words as $val) {
            $tags[] = $val['word'];
        }
        return implode(',', $tags);
    }
      /**
     * 商品搜索结果页
     **/
    public function search(){
        $rzt=$this->get_tags("新款 牛漆皮小尖头直跟高跟单鞋910033 灰羊猄(7.31发货) 39");
        print_r($rzt);
    }
ログイン後にコピー

表示 結果は次のようになります:

漆皮,单鞋,尖头,高跟,新款,发货,910033,7.31,39
ログイン後にコピー


http://www.bkjia.com/PHPjc/1063515.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/1063515.htmlTechArticleThinkphp3.2 は scws を使用します中国語単語分割抽出キーワード SCWS は、Simple Chinese Word Segmentation (つまり、Simple Chinese Word Segmentation System) の略称です。 1. scws が提供する公式クラスをダウンロードします...

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!