如何用redis去重?
过去多啦不再A梦
过去多啦不再A梦 2017-04-25 09:02:08
0
3
933

分別從幾個固定的網站上爬取資料;
為了url去重,我用的字串型儲存?還是用的sets型儲存?

需要儲存url數目,大概初期在100k-1000k之間。

过去多啦不再A梦
过去多啦不再A梦

全部回覆(3)
世界只因有你

用redis集合
連結

巴扎黑

用集合吧,集合的不重複性太適用了。

PHPzhong
$key = 'URL_HASH';
if(!$redis->hGet($key, md5($url))){
    // do something ...
    // 抓取一个 $url 后
    $redis->hSet($key, md5($url), true);
}

這裡要注意的是,如果是多執行緒的,要考慮其他行​​程,可以吧 bool 值改為枚舉值。

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板