这是一个简单快速的词库工具,用来从一段文本中找出存在于词库的词语。
特点
简单:纯 PHP 实现,无需安装扩展。
快速:查找耗时跟词库大小关系不大(我的小破本上查询 40 万的词库轻轻松松),不会一次性加载整个词库,使用时内存占用小(就是生成词库的时候有点费内存)。
https://github.com/nowgoo/dict/
大神能否转成python的,或者python是否已有这种项目?
这是一个简单快速的词库工具,用来从一段文本中找出存在于词库的词语。
特点
简单:纯 PHP 实现,无需安装扩展。
快速:查找耗时跟词库大小关系不大(我的小破本上查询 40 万的词库轻轻松松),不会一次性加载整个词库,使用时内存占用小(就是生成词库的时候有点费内存)。
https://github.com/nowgoo/dict/
大神能否转成python的,或者python是否已有这种项目?
如果你要分词的话,可以考虑结巴分词
https://github.com/fxsjy/jieba
php2python