現在、タイトルごとに単語を分割しています。各タイトルには 3 つの単語が含まれています。
分割された単語を保存するための別のタグ テーブルを作成しました。各単語に 1 つのレコードがあります。関連記事を読むときに、ランダムにタグを読み取ります。タグ テーブルで同じタグを検索するのは、データが少ないときは問題ありませんでしたが、今ではタグ テーブルに 1 億個以上のデータがあり、読み取るのが非常に遅くなります。には、記事 ID と単語分割の 2 つのフィールドのみがあり、すべてインデックスが付けられています。
関連記事を書く他に方法はありますか?
現在、毎日 50,000 件の新しいデータが追加されています
関連性の測定にはいくつかの側面があります:
1. 記事が属するセクション (エンターテイメントなど)
2. 抽出する必要がある記事の中心的なアイデアやテーマは何か
3. 時間に関連するメインオブジェクト (キャラクター、イベント)
記事には複数の主題オブジェクトが含まれる場合があり、セクション間で関連する場合があります