Python pyahocorasick を使用して、おそらく 10 ~ 20 文字の漢字のキーワードを照合します。
ahocorasick の構築に使用されるテキストは、ローカル ファイル key_word から読み取られます。形式は次のとおりです:
母子エリア<補完食<麺類: 乳児、幼児、乳児、児童、乳児 | 麺、細麺、太麺、手打ち麺、野菜麺、栄養麺、折れ麺、乾麺、麺 |
マッチング結果は空です。
コードは以下のように表示されます:
この種の問題を経験した人がいたら、助けてください、サンプル コードを提供するか、解決策を提供してください。ありがとうございます。
2日間のリサーチの後、私はこの関数を自分で実装しました
ローカル ファイルに重複するキーワードが多すぎるため、一致は 100% ではありません
参照コードは次のとおりです:
印刷結果: 母親と赤ちゃんセクション<補完食<麺類/ヌードル