这篇文章专访segmentfault说到: 我们从一开始就会把搜索作为一个优先解决的技术问题。我们在做站内搜索时花了很大的力气。最开始我们用的是Lucene的引擎做了一个Java的一个后端搜索服务,后来我们是把整个搜索全部转移到Redis平台上,用Redis来做站内的搜索,这样效率会比较高,而且搜索起来准确度比较高。
很想了解这个redis如何实现站内搜索的。 感谢知道的人指点方向, 先谢谢啦
欢迎选择我的课程,让我们一起见证您的进步~~
搜索的最基本框架就是 分词 + 倒排索引 啊。权重什么的都是模型的细节(当然对于百度和google来说这个才是重头,要上pagerank什么的)。
redis的set操作,简直就是为了倒排索引定制的。
其实做搜索的方法很多,可以参考这个回答 http://segmentfault.com/q/1010000000663373/a-1020000000702395
我用Lucene比较多,定制性比较强,但开发量和维护量稍大些,最近在尝试使用搜易站内搜索引擎,用在中小型数据量的网站上还是不错的。
搜索的最基本框架就是 分词 + 倒排索引 啊。权重什么的都是模型的细节(当然对于百度和google来说这个才是重头,要上pagerank什么的)。
redis的set操作,简直就是为了倒排索引定制的。
其实做搜索的方法很多,可以参考这个回答 http://segmentfault.com/q/1010000000663373/a-1020000000702395
我用Lucene比较多,定制性比较强,但开发量和维护量稍大些,最近在尝试使用搜易站内搜索引擎,用在中小型数据量的网站上还是不错的。