Kini saya membahagikan perkataan mengikut tajuk, setiap tajuk mempunyai 3 perkataan
Saya telah membina jadual tag yang berasingan untuk menyimpan perkataan yang dibahagikan, dengan satu rekod untuk setiap perkataan Apabila membaca artikel berkaitan, saya membaca teg secara rawak, dan kemudian mencari jadual tag untuk Teg yang sama, tidak mengapa apabila terdapat sedikit data pada masa lalu, tetapi kini terdapat lebih daripada 100 juta keping data dalam jadual teg, dan jadual tag hanya mempunyai 2 medan , id artikel dan pembahagian perkataan semuanya diindeks dan kemudian dibahagikan.
Adakah cara lain untuk menulis artikel berkaitan
Kini 5W+++ ditambah setiap hari
Pengukuran perkaitan harus mempunyai beberapa dimensi:
1, bahagian artikel milik, seperti hiburan
2, apakah idea utama atau tema artikel, ia perlu diekstrak
3, Masa berkaitan dengan objek utama (watak, peristiwa)
Sebuah artikel mungkin mempunyai berbilang objek subjek dan mungkin berkaitan merentas bahagian