首頁 > 後端開發 > Python教學 > 如何使用IKAnalyzer分詞器自訂擴充詞典

如何使用IKAnalyzer分詞器自訂擴充詞典

坏嘻嘻
發布: 2018-09-14 16:54:57
原創
4829 人瀏覽過

本文主要介紹如何使用IKAnalyzer分詞器自訂擴充字典,希望大家可以耐心學習。

下載IKAnalyzer完整分發包後,IK Analyzer安裝包包含: 
1. 《IKAnalyzer中文分詞器V2012使用手冊》 
2. IKAnalyzer2012.jar(主jar包) 
3 . IKAnalyzer.cfg.xml(分詞器擴充設定檔) 
4. stopword.dic(停止字典) 
5. LICENSE.TXT ; NOTICE.TXT (apache版權申明) 
它的安裝部署十分簡單,將IKAnalyzer2012.jar 部署於專案的lib 目錄中;
IKAnalyzer.cfg.xml 與stopword.dic 檔案放置在class 根目錄(對於web 項目,通常是
WEB-INF/classes目錄,同hibernate、log4j等設定檔相同)下即可。 

要擴充自訂字典,開啟IKAnalyzer.cfg.xml

如何使用IKAnalyzer分詞器自訂擴充詞典

#將擴充字典的註解去掉。

如何使用IKAnalyzer分詞器自訂擴充詞典

同時在class根目錄,即src資料夾下自己新建ext.dic檔案。建置好之後用Notepad 軟體開啟ext.dic。

如何使用IKAnalyzer分詞器自訂擴充詞典

相關推薦:

詳解Java開源的11個中文分詞器使用方法和分詞效果比較

使用Discuz關鍵字伺服器實作PHP中文分詞_PHP教學

#

以上是如何使用IKAnalyzer分詞器自訂擴充詞典的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板