這篇文章專訪segmentfault說到: 我們從一開始就會把搜索作為一個優先解決的技術問題。我們在做站內搜索時花了很大的力氣。最開始我們用的是Lucene的引擎做了一個Java的一個後端搜索服務,後來我們是把整個搜索全部轉移到Redis平台上,用Redis來做站內的搜索,這樣效率會比較高,而且搜索起來準確度比較高。
很想了解這個redis如何實現站內搜索的。 感謝知道的人指點方向, 先謝謝啦
欢迎选择我的课程,让我们一起见证您的进步~~
搜尋最基本的架構就是 分詞 + 倒排索引 啊。權重什麼的都是模型的細節(當然對百度和google來說都是重頭,要上pagerank什麼的)。
redis的set操作,簡直就是為了倒排索引定制的。
其實做搜尋的方法很多,可以參考這個回答 http://segmentfault.com/q/1010000000663373/a-1020000000702395
我用Lucene比較多,客製化比較強,但開發量和維護量稍大些,最近在嘗試使用搜易站內搜尋引擎,用在中小型資料量的網站上還是不錯的。
搜尋最基本的架構就是 分詞 + 倒排索引 啊。權重什麼的都是模型的細節(當然對百度和google來說都是重頭,要上pagerank什麼的)。
redis的set操作,簡直就是為了倒排索引定制的。
其實做搜尋的方法很多,可以參考這個回答 http://segmentfault.com/q/1010000000663373/a-1020000000702395
我用Lucene比較多,客製化比較強,但開發量和維護量稍大些,最近在嘗試使用搜易站內搜尋引擎,用在中小型資料量的網站上還是不錯的。