首页 > 后端开发 > Python教程 > 如何使用IKAnalyzer分词器自定义扩展词典

如何使用IKAnalyzer分词器自定义扩展词典

坏嘻嘻
发布: 2018-09-14 16:54:57
原创
4871 人浏览过

本文主要介绍了如何使用IKAnalyzer分词器自定义扩展词典,希望大家可以耐心学习。

下载IKAnalyzer完整分发包后,IK Analyzer安装包包含: 
1. 《IKAnalyzer中文分词器V2012使用手册》 
2. IKAnalyzer2012.jar(主jar包) 
3. IKAnalyzer.cfg.xml(分词器扩展配置文件) 
4. stopword.dic(停止词典) 
5. LICENSE.TXT ; NOTICE.TXT (apache版权申明) 
它的安装部署十分简单,将 IKAnalyzer2012.jar 部署于项目的 lib 目录中;
IKAnalyzer.cfg.xml 与 stopword.dic 文件放置在 class 根目录(对于 web 项目,通常是
WEB-INF/classes目录,同hibernate、log4j等配置文件相同)下即可。 

要扩展自定义词典,打开IKAnalyzer.cfg.xml

20180914141741225.png

将扩展词典的注释去掉。

20180914141829717.png

同时在class根目录,即src文件夹下自己新建ext.dic文件。建好之后用Notepad++软件打开ext.dic。

20180914142129894.png

相关推荐:

详解Java开源的11个中文分词器使用方法和分词效果对比

使用Discuz关键词服务器实现PHP中文分词_PHP教程

以上是如何使用IKAnalyzer分词器自定义扩展词典的详细内容。更多信息请关注PHP中文网其他相关文章!

相关标签:
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
python - ubuntu16.04 lxml的报错
来自于 1970-01-01 08:00:00
0
0
0
有办法在PHP里写Python吗?
来自于 1970-01-01 08:00:00
0
0
0
python scrapy爬虫错误
来自于 1970-01-01 08:00:00
0
0
0
centos7 编译安装 Python 3.5.1 失败
来自于 1970-01-01 08:00:00
0
0
0
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板