Python+pyahocorasick을 사용하여 한자 10~20자 정도의 키워드를 일치시킵니다.
ahocorasick을 구성하는 데 사용되는 텍스트는 로컬 파일 key_word에서 읽습니다. 형식은 다음과 같습니다:
엄마와 아기 구역<보양식<면/면류: 영유아,유아,어린이,아기 | 면, 가는면, 굵은면, 수제면, 야채면, 영양면, 부러진면, 건면, 국수 |
일치 결과가 비어 있습니다.
코드는 다음과 같습니다.
이러한 문제를 경험하신 경우 도움을 주시거나 샘플 코드나 해결 방법을 제공해 주시면 감사하겠습니다!
이틀간의 연구 끝에 이 기능을 직접 구현했습니다
로컬 파일에 반복되는 키워드가 너무 많아 일치율이 100%가 아닙니다
참조 코드는 다음과 같습니다.
인쇄 결과: 엄마와 아기 섹션<보충식품<면/국수