目錄
1. 概述
2. 什麼是基數?
3. 指令
3.1 PFADD
3.2 PFCOUNT
3.3 PFMERGE
首頁 資料庫 Redis Redis怎麼使用HyperLogLog實現

Redis怎麼使用HyperLogLog實現

May 26, 2023 pm 05:41 PM
redis hyperloglog

1. 概述

Redis 在2.8.9 版本增加了HyperLogLog 資料結構,用來做基數統計,其優點是在輸入元素的數量非常大時,計算基數所需的空間比較小並且一般比較恆定。

在 Redis 裡面,每個 HyperLogLog 鍵只需要花費 12 KB 記憶體就可以計算接近 2^64 個不同元素的基數。這和計算基數時,元素越多耗費記憶體越多的集合形成鮮明對比。但是,因為 HyperLogLog 只會根據輸入元素來計算基數,並不會儲存輸入元素本身,所以 HyperLogLog 不能像集合一樣會傳回輸入的各個元素。

2. 什麼是基數?

例如資料集{1, 3, 5, 7, 5, 7, 8}, 那麼這個資料集的基數集是{1, 3, 5 ,7, 8}, 基數(不重複元素)為5。基數估計就是在誤差可接受的範圍內,快速計算基數。

3. 指令

目前只有 PFADD、PFCOUNT 和 PFMERGE 三個指令被 HyperLogLog 支援。我們先來逐一介紹一下。

3.1 PFADD

最早可用版本:2.8.9。時間複雜度:O(1)。

PFADD 指令可以將元素(可以指定多個元素)加入到 HyperLogLog 資料結構中,儲存到第一個參數 key 指定的鍵中。若基數估計(評估的元素個數)發生變化,回傳1,否則傳回0,即在執行指令後確認基數估計是否已變化。如果指定的 key 不存在,那麼就建立一個空的 HyperLogLog 資料結構(即,指定字串長度以及編碼的 Redis String)。也可以呼叫不指定元素參數而只指定鍵的指令。如果鍵存在,不執行任何操作並傳回 0;如果鍵不存在,則會建立新的 HyperLogLog 資料結並且傳回 1。實質上只是產生一個新的 HyperLogLog 資料結構,而不儲存任何元素。

(1) 語法格式:

PFADD key element [element ...]
登入後複製

(2) 傳回值:

整數,如果至少有個元素被加回 1,否則回傳 0。

(3) Example:

127.0.0.1:6379> PFADD hll a b c d e f g
(integer) 1
127.0.0.1:6379> pfcount hll
(integer) 7
登入後複製

3.2 PFCOUNT

最早可用版本:2.8.9。時間複雜度:O(1),對於多個比較大的key的時間複雜度是O(N)。

使用PFCOUNT指令可以得到一個HyperLogLog估算基數的值(也就是元素的數量)。如果鍵不存在,則指令傳回 0,否則傳回該鍵的基數估算值。對於多個鍵,傳回的是多個 HyperLogLog 並集的基數估算值,透過將多個 HyperLogLog 合併為一個臨時的 HyperLogLog 計算基數估算值。使用極少且一貫的記憶體量,HyperLogLog 可以計算集合的唯一元素數量。每個 HyperLogLog 只用 12K 加上鍵本身的幾個位元組。

(1) 語法格式:

PFCOUNT key [key ...]
登入後複製

(2) 傳回值:

整數,傳回指定HyperLogLog 的基數估算值,如果多個HyperLogLog 則傳回並集的基數估算值。

(3) Example:

127.0.0.1:6379> PFADD hll foo bar zap
(integer) 1
127.0.0.1:6379> PFADD hll zap zap zap
(integer) 0
127.0.0.1:6379> PFADD hll foo bar
(integer) 0
127.0.0.1:6379> PFCOUNT hll
(integer) 3
127.0.0.1:6379> PFADD some-other-hll 1 2 3
(integer) 1
127.0.0.1:6379> PFCOUNT some-other-hll
(integer) 3
127.0.0.1:6379> PFCOUNT hll some-other-hll
(integer) 6
登入後複製

(4) 限制:

HyperLogLog 回傳的結果並不精確,錯誤率大概在 0.81% 左右。

使用這個指令將會改變 HyperLogLog,並且使用 8 個位元組來儲存上一次計算的基數。所以,從技術角度來講,PFCOUNT 是一個寫指令。

(5) 效能問題

即使理論上處理一個密集型 HyperLogLog 需要花費較長時間,但是當只指定一個鍵時,PFCOUNT 指令仍然具有很高的效能。這是因為 PFCOUNT 會快取上一次計算的基數,而這個基數並不會一直變動,因為 PFADD 指令大多數情況下不會更新暫存器。所以才可以達到每秒上百次請求的效果。

當使用 PFCOUNT 指令處理多個鍵時,會對 HyperLogLog 進行合併操作,這一步非常耗時,更重要的是透過計算出來的並集的基數是不能快取的。使用多個按鍵時,PFCOUNT 的執行可能需要花費一些時間(通常為毫秒級),因此建議不要過度使用。

需要注意的是,該命令的單鍵和多鍵執行語義是不同的並且具有不同的性能。不建議過度使用多鍵執行語意。

3.3 PFMERGE

最早可用版本:2.8.9。時間複雜度:O(N),N是要合併的HyperLogLog的數量。

多個 HyperLogLog 可以透過 PFMERGE 指令合併成一個 HyperLogLog。合併後的 HyperLogLog 的基數估算值是透過對所有給定 HyperLogLog 進行並集計算得出的。計算完的結果儲存到指定的鍵中。

語法格式:

PFMERGE destkey sourcekey [sourcekey ...]
登入後複製

傳回值:

傳回 OK。

Example:

127.0.0.1:6379> PFADD hll1 foo bar zap a
(integer) 1
127.0.0.1:6379> PFADD hll2 a b c foo
(integer) 1
127.0.0.1:6379> PFMERGE hll3 hll1 hll2
OK
127.0.0.1:6379> PFCOUNT hll3
(integer) 6
登入後複製

以上是Redis怎麼使用HyperLogLog實現的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1665
14
CakePHP 教程
1424
52
Laravel 教程
1322
25
PHP教程
1270
29
C# 教程
1249
24
redis集群模式怎麼搭建 redis集群模式怎麼搭建 Apr 10, 2025 pm 10:15 PM

Redis集群模式通過分片將Redis實例部署到多個服務器,提高可擴展性和可用性。搭建步驟如下:創建奇數個Redis實例,端口不同;創建3個sentinel實例,監控Redis實例並進行故障轉移;配置sentinel配置文件,添加監控Redis實例信息和故障轉移設置;配置Redis實例配置文件,啟用集群模式並指定集群信息文件路徑;創建nodes.conf文件,包含各Redis實例的信息;啟動集群,執行create命令創建集群並指定副本數量;登錄集群執行CLUSTER INFO命令驗證集群狀態;使

redis數據怎麼清空 redis數據怎麼清空 Apr 10, 2025 pm 10:06 PM

如何清空 Redis 數據:使用 FLUSHALL 命令清除所有鍵值。使用 FLUSHDB 命令清除當前選定數據庫的鍵值。使用 SELECT 切換數據庫,再使用 FLUSHDB 清除多個數據庫。使用 DEL 命令刪除特定鍵。使用 redis-cli 工具清空數據。

redis怎麼讀取隊列 redis怎麼讀取隊列 Apr 10, 2025 pm 10:12 PM

要從 Redis 讀取隊列,需要獲取隊列名稱、使用 LPOP 命令讀取元素,並處理空隊列。具體步驟如下:獲取隊列名稱:以 "queue:" 前綴命名,如 "queue:my-queue"。使用 LPOP 命令:從隊列頭部彈出元素並返回其值,如 LPOP queue:my-queue。處理空隊列:如果隊列為空,LPOP 返回 nil,可先檢查隊列是否存在再讀取元素。

centos redis如何配置Lua腳本執行時間 centos redis如何配置Lua腳本執行時間 Apr 14, 2025 pm 02:12 PM

在CentOS系統上,您可以通過修改Redis配置文件或使用Redis命令來限制Lua腳本的執行時間,從而防止惡意腳本佔用過多資源。方法一:修改Redis配置文件定位Redis配置文件:Redis配置文件通常位於/etc/redis/redis.conf。編輯配置文件:使用文本編輯器(例如vi或nano)打開配置文件:sudovi/etc/redis/redis.conf設置Lua腳本執行時間限制:在配置文件中添加或修改以下行,設置Lua腳本的最大執行時間(單位:毫秒)

redis命令行怎麼用 redis命令行怎麼用 Apr 10, 2025 pm 10:18 PM

使用 Redis 命令行工具 (redis-cli) 可通過以下步驟管理和操作 Redis:連接到服務器,指定地址和端口。使用命令名稱和參數向服務器發送命令。使用 HELP 命令查看特定命令的幫助信息。使用 QUIT 命令退出命令行工具。

redis計數器怎麼實現 redis計數器怎麼實現 Apr 10, 2025 pm 10:21 PM

Redis計數器是一種使用Redis鍵值對存儲來實現計數操作的機制,包含以下步驟:創建計數器鍵、增加計數、減少計數、重置計數和獲取計數。 Redis計數器的優勢包括速度快、高並發、持久性和簡單易用。它可用於用戶訪問計數、實時指標跟踪、遊戲分數和排名以及訂單處理計數等場景。

redis過期策略怎麼設置 redis過期策略怎麼設置 Apr 10, 2025 pm 10:03 PM

Redis數據過期策略有兩種:定期刪除:定期掃描刪除過期鍵,可通過 expired-time-cap-remove-count、expired-time-cap-remove-delay 參數設置。惰性刪除:僅在讀取或寫入鍵時檢查刪除過期鍵,可通過 lazyfree-lazy-eviction、lazyfree-lazy-expire、lazyfree-lazy-user-del 參數設置。

如何優化debian readdir的性能 如何優化debian readdir的性能 Apr 13, 2025 am 08:48 AM

在Debian系統中,readdir系統調用用於讀取目錄內容。如果其性能表現不佳,可嘗試以下優化策略:精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄,降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制,定期或在目錄內容變更時更新緩存,減少對readdir的頻繁調用。內存緩存(如Memcached或Redis)或本地緩存(如文件或數據庫)均可考慮。採用高效數據結構:如果自行實現目錄遍歷,選擇更高效的數據結構(例如哈希表而非線性搜索)存儲和訪問目錄信

See all articles