> 백엔드 개발 > 파이썬 튜토리얼 > IKAnalyzer 토크나이저를 사용하여 확장 사전을 사용자 정의하는 방법

IKAnalyzer 토크나이저를 사용하여 확장 사전을 사용자 정의하는 방법

坏嘻嘻
풀어 주다: 2018-09-14 16:54:57
원래의
4832명이 탐색했습니다.

이 글에서는 주로 IKAnalyzer 단어 분할기를 사용하여 확장 사전을 사용자 정의하는 방법을 소개합니다.

IKAnalyzer 전체 배포 패키지를 다운로드한 후 IK 분석기 설치 패키지에는
1 "IKAnalyzer Chinese Word Segmenter V2012 사용자 설명서"
2(기본 jar) 패키지)
3. IKAnalyzer.cfg.xml(단어 분할기 확장 구성 파일)
4. stopword.dic(사전 중지)
5(apache 저작권 설명) ) # 🎜🎜# 설치 및 배포는 매우 간단합니다. 프로젝트의 lib 디렉터리에 IKAnalyzer2012.jar을 배포하고
IKAnalyzer.cfg.xml 및 stopword.dic 파일은 클래스 루트 디렉터리에 배치됩니다(웹 프로젝트의 경우). , 일반적으로 #🎜 🎜#WEB-INF/classes 디렉터리이며 최대 절전 모드, log4j 및 기타 구성 파일과 동일합니다.

사용자 정의 사전을 확장하려면 IKAnalyzer.cfg.xml

IKAnalyzer 토크나이저를 사용하여 확장 사전을 사용자 정의하는 방법을 열고 확장된 사전의 설명을 제거합니다.

IKAnalyzer 토크나이저를 사용하여 확장 사전을 사용자 정의하는 방법동시에 클래스 루트 디렉터리, 즉 src 폴더에 새로운 ext.dic 파일을 생성합니다. 빌드된 후 Notepad++ 소프트웨어로 ext.dic을 엽니다.

IKAnalyzer 토크나이저를 사용하여 확장 사전을 사용자 정의하는 방법관련 추천:


자세한 사용법 설명 중국어 단어 분할기 단어 분할 효과와의 비교

Disuz 키워드 서버를 사용하여 PHP 구현 중국어 단어 분할_PHP 튜토리얼

위 내용은 IKAnalyzer 토크나이저를 사용하여 확장 사전을 사용자 정의하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿