假设有如下的多条数据:
佛山市威尔康乳胶制品有限公司 爱奥乐医疗器械(深圳)有限公司 ...
现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。
这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下
这属于命名实体识别(NER),如果你只是想应用而已,直接import jieba就行了。
import jieba
如果是想具体学习原理,推荐论文NLP from scratch
这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下
这属于命名实体识别(NER),如果你只是想应用而已,直接
import jieba
就行了。如果是想具体学习原理,推荐论文NLP from scratch