python - 如何判断字符串为企业注册名称
曾经蜡笔没有小新
曾经蜡笔没有小新 2017-05-18 10:55:32
0
2
753

假设有如下的多条数据:

佛山市威尔康乳胶制品有限公司
爱奥乐医疗器械(深圳)有限公司
...

现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。

曾经蜡笔没有小新
曾经蜡笔没有小新

全部回复(2)
Ty80

这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下

洪涛

这属于命名实体识别(NER),如果你只是想应用而已,直接import jieba就行了。

如果是想具体学习原理,推荐论文NLP from scratch

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板