java - 使用什么样的技术为内容打标签?
黄舟
黄舟 2017-04-17 17:31:52
0
4
929

背景描述:
系统内部有医院,案例,医生,特卖产品的实体,需要给这些实体打标签,即在数据库中存一个标签字段,比如为一些医院,案例打上双眼皮的标签。打上的标签是供APP搜索使用的。目前的做法是让运营人员通过CMS系统手动给这些实体添加标签。但效率低下。怎样能够自动给这些实体打上标签,运营人员只需要配置标签即可。打标签的规则可以是匹配如医院介绍的文字,医院名称等字符串匹配。但存在比如需要给双眼皮的案例打上如杨庆峰(一个做双眼皮非常厉害的医生)的标签,这就麻烦了。目前这几种实体的数据记录总数在8000左右,为了让搜索时候各种记录有大致相同的被搜索到的机会,仅靠运营人员给部分记录手动打标签就不太合适了,会导致大部分记录无法被搜索出来。

技术咨询:
使用怎样的思想处理这样的问题,使用怎样的技术进行实际操作?

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全員に返信(4)
黄舟

タグ付けにテキスト分類を使用できます

いいねを押す +0
阿神

単語分割アルゴリズムを使用してコンテンツ コレクションを分割し、高頻度の単語と特定の指定された単語をテキストのラベルとして抽出します

いいねを押す +0
洪涛

私の個人的な意見では、タグ ライブラリを用意し、そのタグ ライブラリ内のテキストを、あなたが言及した病院の紹介文や病院名などと一致させるのが最善です。これを実現するには、通常のルールを使用できます。二重まぶたを人の名前と一致させたい場合は、一致ルールをカスタマイズするだけです。

いいねを押す +0
黄舟

JAVA がわかりませんので、いくつか意見をお聞かせください。
必要なのは単語の分割であり、得られる有用な情報に基づいて単語を分割します。私は以前に python の自然言語処理関連ライブラリについて大まかに理解していたので、元の投稿者の問題は解決できるはずです。

ご指摘のトラブルの内容がよくわかりませんが、この件に該当する医師情報が取得できないのでしょうか、それともデータ構造に問題があるのでしょうか?

しかし、二重まぶたの場合は楊清峰(二重まぶたを得意とする医師)のような人にラベルを付けてもらう必要がある場合もあり、面倒です。

最後に、ここでの語彙のソースについて話しましょう。上記の既存の情報に基づく単語の分割に加えて、検索エンジンの業界関連の検索用語、サイト上の検索用語、および関連検索も含まれます。実際、単語 (検索量の多い単語) の 80% が解決されていれば、ユーザー エクスペリエンスはより高いレベルに上がります。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!