请问一下微博和百度贴吧的热门话题排行榜是如何生成的？

Question

微博和贴吧都是国内数一数二的PHP构建的高并发网站，请问他们的这个热门话题排行榜是如何得出的？我目前只想得到用中文分词库对全站内容分词和统计，但是这类高并发网站每天都是成千上亿的数据产出，用分词的话如何是如果解决效率问题的？或者他们还用了其他什么技术？

代言 · Answer

这些热数据肯定不是靠php统计出来的，应该是php调了排行的接口只负责展示

代言 · Answer

我最近也在做类似的功能。思路是这样：

最后得到话题排行榜

代言 · Answer

列表前的文本是手工加的，非机器自动生成。后面的数字猜测是在有带关键字微博发出时，向指定缓存字段+1。这些数据其实非常不准确，然而也并没有要准确的必要。