この記事の例では、Python での中国語単語の分割の実装方法を説明します。参考のために皆さんと共有してください。詳細は次のとおりです:
Pythonではpymmseg-cppがとても便利です!
環境 ubuntu10.04、python2.65
手順:
1 mmseg-cpp のソース コードをダウンロードします http://code.google.com/p/pymmseg-cpp/
2 実行:
tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录 cd pymmseg\mmseg-cpp python build.py #生成 mmseg.so文件
3 pymmseg ディレクトリを /usr/local/lib/python2.6/dist-packages にコピーします
4 テストが成功したかどうか:
test.py ファイル:
from pymmseg import mmseg mmseg.dict_load_defaults() text = '今天的天气真好啊,我们一起出去玩一下吧' algor = mmseg.Algorithm(text) for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end)
Python 関連のコンテンツにさらに興味がある読者は、このサイトの特別トピックをチェックしてください: 「Python 画像操作スキルの概要」、「Python データ構造とアルゴリズムのチュートリアル」、「Python ソケット プログラミング スキルの概要」、「 Python 関数の使用スキルのまとめ」、「Python の文字列操作のスキルのまとめ」、「Python 入門と上級の古典的なチュートリアル」、および「Python ファイルとディレクトリの操作のスキルのまとめ」
この記事が Python プログラミングのすべての人に役立つことを願っています。