84669 personnes étudient
152542 personnes étudient
20005 personnes étudient
5487 personnes étudient
7821 personnes étudient
359900 personnes étudient
3350 personnes étudient
180660 personnes étudient
48569 personnes étudient
18603 personnes étudient
40936 personnes étudient
1549 personnes étudient
1183 personnes étudient
32909 personnes étudient
比如我提出个问题,怎样切词提取关键词,怎么创建简单的语料库,怎样组合词语匹配到提出的问题。我想用php实现,求思路,求技术指点,求各种助攻,先拜谢了
ringa_lee
这个问题我来回答完全就是献丑了。。。
这个问题应该是学习机器学习、NLP相关的研究生能够回答的吧。
分词。我只用过python的jieba这个分词库。一般分词都是有第三方库吧。
jieba
创建语料库。这个没接触过,不了解。网上有很多开源的语料库。
组合词语匹配提出的问题。这个我感觉不是我能解决的,我只能提出我的想法,首先提取出问题的关键词或者关键短语吧,之前在github上有一个用TextPage算法实现的提取关键词和摘要的代码,然而效果不咋滴;然后,使用关键词或者关键短语到你的训练数据中匹配到解决问题的方法;最后在组合为句子或者段落。
这个问题我来回答完全就是献丑了。。。
这个问题应该是学习机器学习、NLP相关的研究生能够回答的吧。
分词。我只用过python的
jieba
这个分词库。一般分词都是有第三方库吧。创建语料库。这个没接触过,不了解。网上有很多开源的语料库。
组合词语匹配提出的问题。这个我感觉不是我能解决的,我只能提出我的想法,首先提取出问题的关键词或者关键短语吧,之前在github上有一个用TextPage算法实现的提取关键词和摘要的代码,然而效果不咋滴;然后,使用关键词或者关键短语到你的训练数据中匹配到解决问题的方法;最后在组合为句子或者段落。