以下由Redis教學專欄為大家介紹關Redis中的Scan指令的使用詳解,希望對需要的朋友有幫助!
Redis中有一個經典的問題,在龐大的資料量的情況下,做類似尋找符合某種規則的Key的訊息,這裡就有兩種方式,
一是keys命令,簡單粗暴,由於Redis單線程這一特性,keys命令是以阻塞的方式執行的,keys是以遍歷的方式實現的複雜度是O(n),Redis庫中的key越多,查找實現代價越大,產生的阻塞時間越長。
二是scan指令,以非阻塞的方式實作key值的查找,絕大多數情況下是可以取代keys指令的,可選性更強
以下寫入100000條key** *:value***格式的測試資料(ps:用pipline的話,1w一筆,每一筆在秒級完成)
# -*- coding: utf-8 -*- # !/usr/bin/env python3 import redis import sys import datetimedef create_testdata(): r = redis.StrictRedis(host='***.***.***.***', port=***, db=0, password='***') counter = 0 with r.pipeline(transaction=False) as p: for i in range(0, 100000): p.set('key' + str(i), "value" + str(i)) counter = counter + 1 if (counter == 10000): p.execute() counter = 0 print("set by pipline loop") if __name__ == "__main__": create_testdata()
例如這裡查詢key111開頭的key有哪些?
若使用keys指令,則執行keys key1111*,一次全部查出來。
同樣,如果使用scan指令,則用 scan 0 match key1111* count 20
scan的語法為:SCAN cursor [MATCH pattern] [COUNT count] The default COUNT value is 10.
SCAN指令是一個基於遊標的迭代器。這意味著指令每次被呼叫都需要使用上一次這個呼叫所傳回的遊標作為該次呼叫的遊標參數,以此來延續先前的迭代過程。
這裡使用scan 0 match key1111* count 20指令來完成這個查詢,稍顯意外的是,使用一開始都沒有查詢到結果,這個要從scan指令的原理來看。
scan在遍歷key的時候,0就代表第一次,key1111*代表依照key1111開頭的模式匹配,count 20中的20並不是代表輸出符合條件的key,而是限定伺服器單次遍歷的字典槽位數量(約等於)。
那麼,什麼又叫做槽的資料?這個槽是不是Redis集群中的slot?答案是否定的。其實上圖已經給了答案。
如果上面說的「字典槽」的數量是集群中的slot,又知道集群中的slot數量是16384,那麼遍歷16384個槽之後,必然能遍歷出來所有的key信息,
上面清楚地看到,當遍歷的字典槽的數量20000的時候,遊標依舊沒有走完遍歷結果,因此這個字典槽並不等於集群中的slot的概念。
經過測試,在scan的時候,究竟遍歷多大的COUNT值能完全match到符合條件的key,跟具體對象的key的個數有關,
如果以超過key個數的count來scan,必定會一次性就查找到所有符合條件的key,例如在key個數為10W個的情況下,一次遍歷20w個字典槽,肯定能完全遍歷出來結果。
scan 指令是一系列指令,除了可以遍歷所有的 key 之外,還可以對指定的容器集合進行遍歷。
zscan 遍歷 zset 集合元素,
hscan 遍歷 hash 字典的元素、
sscan 遍歷 set 集合的元素。
SSCAN 指令、 HSCAN 指令和 ZSCAN 指令的第一個參數總是一個資料庫鍵(某個指定的key)。
另外,使用redis desktop manager的時候,當刷新某個函式庫的時候,控制台自動不斷刷新scan指令,也就知道它在幹嘛了
###
以上是Redis中的Scan指令的使用詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!