セット コレクションに整数が格納される場合、エンコードは intset 型 (小さい整数のコレクション)
typedef struct intset { int32 encoding; int32 length; int contents[]; }
Description | 説明 | |
---|---|---|
整数のビット幅が 16 ビット、32 ビット、または 64 ビットのいずれであるかを決定します。 | 列挙表現 | |
要素数 | ||
整数配列, 要素の値を保存する |
hash-max-ziplist-entries 512 # 当hash元素个数小于512时 hash-max-ziplist-value 64 # 当hash键或值长度小于64时 zset-max-ziplist-entries 128 # 当zset元素个数小于128时 zset-max-ziplist-value 64 # 当zset值小于64时
typedef struct ziplist { int32 zlbytes; int32 zltail_offset; int16 zllength; T[] entries; int8 zlend; } typedef struct entry { int<var> prevlen; int<var> encoding; byte[] content; }
説明 | zlbytes | |
---|---|---|
##zltail_offset | 圧縮リストの開始位置からの最後の要素のオフセット||
zllength | 要素の数 | |
entries | 圧縮された要素||
##zlend | の終わりをマークします。圧縮リスト | |
##フィールド |
前のエントリのバイト長 | 最初のエントリは常に 0 であり、バイト長は動的に変化します。 254 場合は 1 バイトを使用し、それ以外の場合は 5 バイトを使用します。 | |||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
エンコーディング タイプ | エンコーディング タイプは要素の内容に応じて動的に変化します。は非常に複雑です。この記事では詳しく説明しません。ziplist エンコード タイプ | |||||||||||||||||||||||||||||||||||||
要素のコンテンツ (オプション | #) を検索できます。 | |||||||||||||||||||||||||||||||||||||
字段 | 描述 | 说明 |
---|---|---|
header | 指向跳跃列表的头指针 | value固定为NULL,score固定为0,backward为null |
tail | 指向跳跃列表的尾指针 | |
maxLevel | 当前跳跃表最大层数 | 最大为64 |
value | 用于存储字符串类型的数据 | |
score | 用于存储分值 | |
backward | 回退节点 | 图中的←箭头 |
forwards | 前进节点 | 图中的→箭头,每一层对应一个 |
span | 跨度,存储一个节点跳到下一个节点中间跳过了多少节点 | 如score1指向score5,则span值为4,这是排名的实现原理 |
最小分值的backward固定null,对于每一个新插入的节点,会调用一个随机算法,来给它分配一个合理的层数
level1的概率为1-0.25=0.75
,实际为100%,因为跳跃列表的最小层数为1
level2的概率为0.75*0.25=0.1875
level3的概率为0.1875*0.25=0.0468
......
leveln的概率为(1-0.25)*Math.pow(0.25,n-1)
Redis作为单线程内存服务,在响应、数据结构上作出了很多的优化,值得我们学习
对象类型 | 编码类型 |
---|---|
string | int、raw、embstr |
list | quicklist |
hash | dict、ziplist |
set | intset、dict |
zset | ziplist、skiplist+dict |
HyperLogLog的原理为伯努利试验,即丢硬币,根据连续出现反面的次数X,推算出一共丢了2的X次方次硬币,当X很大时,推算出来的总数与实际总数误差就很接近了。具体可查询其他文章。
element经过hash算法之后是一个64位的固定值
低14位为桶
查找高50位第一个为1的位数,如果大于当前桶的位数,就将其设置为当前桶的位数
假设hash值是 :{此处省略45位}01100 00000000000101
低14位的二进制转为10进制,值为5(regnum),即我们把数据放在第5个桶
高50位第一个1的位置是3,即count值为3
registers[5]取出历史值oldcount
如果count > oldcount,则更新 registers[5] = count
如果count <= oldcount,则不做任何处理
HyperLogLog用了16384个桶,每个桶占用6bit,因此说一个HyperLogLog所占用内存是12K。
调和平均数:
假设我的工资为10_000,马云的工资为1_000_000,那我和马云的平均工资为505_000,我肯定是不认同的。。。
如果使用调和平均数,则为2/(1/10_000+1/1_000_000)=19_801
同理,桶位数的平均数为:n/(1/桶1位数+1/桶2位数+...+1/桶n位数)
桶的平均个数为:Math.pow(2,桶位数的平均数)
总数量:const*桶总数n*桶的平均个数,其中constant为不定值,与桶个数有关,假设m为桶个数,取对数
p=log2m switch (p) { case 4: constant = 0.673 * m * m; case 5: constant = 0.697 * m * m; case 6: constant = 0.709 * m * m; default: constant = (0.7213 / (1 + 1.079 / m)) * m * m; }
以上がRedis データ構造タイプのサンプル コード分析の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。