python - 文本特征词提取算法
PHP中文网
PHP中文网 2017-04-18 09:25:22
0
2
685
PHP中文网
PHP中文网

认证高级PHP讲师

全部回覆(2)
PHPzhong

題主的這個問題,其實是中文處理。 首先說一下,我不是什麼大牛哈,不過倒是做過這方面調查,在這裡給題主分享一下思路吧:
1 文字處理,需要詞庫,沒有詞庫是無法分詞、詞幹化的,但詞庫這種東西,不是個人、小團體能造出來得
2 字庫:http://www.afenxi.com/post/9700
3 有了字庫,你可能還要針對你要處理的業務去“劃一些界限”和“規則”,要讓機器自己知道遇到多個選擇、矛盾的選擇應該如何處理,這就有點兒“機器學習”的意思了
4 機器學習,怎麼教呢? 得有教科書、題庫,讓機器做,那就是對應的前面的詞庫和N多篇文章
5 巴拉巴拉說了好幾句,具體工具沒說幾個呵呵~~~
6 最直接的辦法: 去智聯,搜中文處理職位,看他們的技能要求,基本上就OK了

刘奇

效果

參考地址

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板