请问一下微博和百度贴吧的热门话题排行榜是如何生成的?
高洛峰
高洛峰 2016-10-22 16:02:54
0
1
701

1.png

微博和贴吧都是国内数一数二的PHP构建的高并发网站,请问他们的这个热门话题排行榜是如何得出的?我目前只想得到用中文分词库对全站内容分词和统计,但是这类高并发网站每天都是成千上亿的数据产出,用分词的话如何是如果解决效率问题的?或者他们还用了其他什么技术?

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

répondre à tous(1)
三叔

我最近也在做类似的功能。思路是这样:

对最近的文本聚类,得到topic

考虑topic包含的文档数量和文档来源的权重

考虑topic的时间

最后得到话题排行榜


Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal