Analisis ringkas HyperLogLog untuk pembelajaran jenis data Redis-Redis-php.cn

Jadual Kandungan

Algoritma HyperLogLog

PFADD

PFCOUNT

PFMERGE

Senario Perniagaan

Rumah

pangkalan data

Redis

Analisis ringkas HyperLogLog untuk pembelajaran jenis data Redis

青灯夜游

Jan 21, 2022 am 10:00 AM

hyperloglog redis jenis data

Artikel ini akan membawa anda memahami HyperLogLog dalam jenis data Redis, yang biasanya digunakan untuk mengira bilangan elemen unik dalam koleksi saya harap ia akan membantu anda!

Analisis ringkas HyperLogLog untuk pembelajaran jenis data Redis

Hari ini adalah hari Jumaat, anda sedang memancing dengan gembira, dan pengurus produk menghantar dokumen keperluan kepada anda melalui e-mel. Permintaan itu mungkin: syarikat perlu mengira IP pelawat harian tapak web, dan statistik ini adalah tingkah laku jangka panjang, antara beberapa bulan hingga beberapa tahun.

Selepas membaca keperluan, anda akan fikir ini sangat mudah Anda boleh melaksanakan fungsi ini dengan mudah menggunakan jenis koleksi Redis: menjana kunci jenis koleksi setiap hari, gunakan SADD untuk menyimpan IP pelawat harian, dan. gunakan arahan SCARD untuk mendapatkan bilangan IP pelawat setiap hari dengan mudah.

Anda cepat selesai menaip kod dan lulus ujian, dan fungsi itu dalam talian. Selepas pergi dalam talian dan berjalan untuk satu tempoh masa, anda akan mendapati bahawa pelayan di mana Redis berada mula penggera Sebabnya ialah penggunaan memori beberapa kekunci terlalu besar tetapkan kunci yang menyimpan IP pelawat. Selepas itu baru anda menepuk kepala anda, mengetahui bahawa anda telah menggali lubang besar untuk diri anda sendiri.

Anggapkan bahawa menyimpan alamat IP dalam format IPv4 mengambil masa sehingga 15 bait dan tapak web tersebut mempunyai sehingga 1 juta pelawat setiap hari. Kekunci set ini akan menggunakan memori 0.45 GB sebulan dan memori 5.4 GB setahun Ini hanya anggaran format IPv4 Jika format IPv6 akan menduduki lebih banyak memori. Walaupun kerumitan masa SADD dan SCARD ialah O(1), penggunaan ingatan mereka tidak boleh diterima.

Anda melayari laman web rasmi Redis dan mendapati bahawa Redis juga menyediakan jenis data HyperLogLog, yang bukan sahaja dapat memenuhi keperluan produk tetapi juga menduduki kurang memori. [Cadangan berkaitan: Tutorial video Redis]

Algoritma HyperLogLog

HyperLogLog ialah algoritma probabilistik yang dicipta khusus untuk mengira kardinaliti set kardinaliti anggaran set tertentu boleh dikira.

Kardinaliti anggaran bukanlah kardinaliti sebenar set Ia mungkin lebih kecil sedikit atau lebih besar daripada kardinaliti sebenar, tetapi ralat antara kardinaliti anggaran dan kardinaliti sebenar akan berada dalam julat yang munasabah mereka yang tidak memerlukan statistik yang sangat tepat boleh dicapai menggunakan algoritma HyperLogLog.

Kelebihan HyperLogLog ialah memori yang diperlukan untuk mengira kardinaliti anggaran tidak berubah disebabkan saiz set Tidak kira berapa banyak elemen yang terkandung dalam set, memori yang diperlukan untuk mengira HyperLogLog sentiasa tetap , dan sangat sedikit.

Setiap jenis HyperLogLog Redis hanya perlu menggunakan 12KB ruang memori untuk mengira hampir: 2⁶⁴ elemen, dan ralat standard algoritma hanya 0.81%.

Jika anda menggunakan jenis HyperLogLog untuk melaksanakan fungsi di atas, jika terdapat 1 juta pelawat setiap hari, ia hanya akan menduduki 360KB memori dalam satu bulan.

PFADD

Arahan PFADD boleh mengira satu atau lebih elemen set yang diberikan.

PFADD key element [element...]

Bergantung pada sama ada elemen yang diberikan telah dikira, arahan PFADD boleh mengembalikan 0 atau 1:

Jika elemen yang diberikan Semua elemen mempunyai telah dikira, maka arahan PFADD akan mengembalikan 0, menunjukkan bahawa kardinaliti anggaran yang dikira oleh HyperLogLog tidak berubah.
Arahan PFADD akan mengembalikan 1 jika kardinaliti anggaran yang dikira oleh HyperLogLog berubah disebabkan kehadiran sekurang-kurangnya satu elemen dalam elemen tertentu yang belum dikira sebelum ini.

Contohnya:

redis> PFADD letters a b c -- 第一次添加
(integer) 1
redis> PFADD letters a     -- 第二次添加
(integer) 0

Salin selepas log masuk

Ia juga boleh dilakukan jika anda hanya menentukan kunci tanpa menyatakan elemen semasa memanggil arahan ini Jika kunci itu wujud, tiada operasi . Jika tidak wujud, struktur data akan dibuat (kembali 1).

PFCOUNT

Anggaran kardinaliti yang dikira oleh HyperLogLog untuk koleksi boleh diperolehi melalui arahan PFCOUNT. Jika kunci yang diberikan tidak wujud, 0 akan dikembalikan.

PFCOUNT key [key...]

Contohnya:

redis> PFCOUNT letters
(integer) 3

Salin selepas log masuk

Apabila berbilang HyperLogLog dihantar ke PFCOUNT, arahan PFCOUNT akan mula-mula mencari kesatuan semua HyperLogLogs dan kemudian mengembalikan Anggaran asas.

redis> PFADD letters1 a b c
(integer) 1
redis> PFADD letters2 c d e
(integer) 1
redis> PFCOUNT letters1 letters2
(integer) 5

Salin selepas log masuk

PFMERGE

Arahan PFMERGE boleh melakukan pengiraan kesatuan pada berbilang HyperLogLog, dan kemudian simpan HyperLogLog kesatuan yang dikira pada kekunci yang ditentukan.

PFMERGE destKey sourceKey [sourceKey...]

Jika kunci yang ditentukan sudah wujud, arahan PFMERGE akan menimpa kekunci sedia ada.

redis> PFADD letters1 a b c
(integer) 1
redis> PFADD letters2 c d e
(integer) 1
redis> PFMERGE res letters1 letters2
OK
redis> PFCOUNT res
(integer) 5

Salin selepas log masuk

Anda boleh melihat bahawa arahan PFMERGE dan PFCOUNT adalah sangat serupa Malah, arahan PFCOUNT melakukan operasi berikut apabila mengira asas anggaran berbilang HyperLogLog:

Dalam Perintah PFMERGE dipanggil secara dalaman untuk mengira kesatuan semua HyperLogLog yang diberikan dan menyimpan kesatuan ke dalam HyperLogLog sementara.
Laksanakan arahan PFCOUNT pada HyperLogLog sementara untuk mendapatkan kardinaliti anggarannya.
Padamkan HyperLogLog sementara.
Mengembalikan pangkalan anggaran yang terhasil.

Apabila program perlu memanggil arahan PFCOUNT pada berbilang HyperLogLogs, dan panggilan ini mungkin diulang beberapa kali, anda boleh mempertimbangkan untuk menggantikan panggilan ini dengan panggilan arahan PFMERGE yang sepadan: dengan menggabungkan keputusan pengiraan disimpan dalam HyperLogLog yang ditentukan dan bukannya mengira semula kesatuan setiap kali, dan program boleh meminimumkan pengiraan kesatuan yang tidak perlu.

Senario Perniagaan

Ciri HyperLogLog sangat sesuai untuk: pengiraan (statistik bulanan, tahunan), penyahduplikasi (pengesan SMS spam) dan senario lain.

Untuk lebih banyak pengetahuan berkaitan pengaturcaraan, sila lawati: Pengenalan kepada Pengaturcaraan! !

Atas ialah kandungan terperinci Analisis ringkas HyperLogLog untuk pembelajaran jenis data Redis. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Assassin's Creed Shadows - Cara Mencari Orang Panda

1 bulan yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

3 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7622

Tutorial CakePHP

1389

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

138

Tunjukkan Lagi

Related knowledge

Cara Membina Mod Kluster Redis Apr 10, 2025 pm 10:15 PM

Mod Redis cluster menyebarkan contoh Redis ke pelbagai pelayan melalui sharding, meningkatkan skalabilitas dan ketersediaan. Langkah -langkah pembinaan adalah seperti berikut: Buat contoh Redis ganjil dengan pelabuhan yang berbeza; Buat 3 contoh sentinel, memantau contoh redis dan failover; Konfigurasi fail konfigurasi sentinel, tambahkan pemantauan maklumat contoh dan tetapan failover; Konfigurasi fail konfigurasi contoh Redis, aktifkan mod kluster dan tentukan laluan fail maklumat kluster; Buat fail nodes.conf, yang mengandungi maklumat setiap contoh Redis; Mulakan kluster, laksanakan perintah Buat untuk membuat kluster dan tentukan bilangan replika; Log masuk ke kluster untuk melaksanakan perintah maklumat kluster untuk mengesahkan status kluster; buat

Cara membersihkan data redis Apr 10, 2025 pm 10:06 PM

Cara Mengosongkan Data Redis: Gunakan perintah Flushall untuk membersihkan semua nilai utama. Gunakan perintah flushdb untuk membersihkan nilai utama pangkalan data yang dipilih sekarang. Gunakan Pilih untuk menukar pangkalan data, dan kemudian gunakan FlushDB untuk membersihkan pelbagai pangkalan data. Gunakan perintah DEL untuk memadam kunci tertentu. Gunakan alat REDIS-CLI untuk membersihkan data.

Cara Membaca Gilir Redis Apr 10, 2025 pm 10:12 PM

Untuk membaca giliran dari Redis, anda perlu mendapatkan nama giliran, membaca unsur -unsur menggunakan arahan LPOP, dan memproses barisan kosong. Langkah-langkah khusus adalah seperti berikut: Dapatkan nama giliran: Namakannya dengan awalan "giliran:" seperti "giliran: my-queue". Gunakan arahan LPOP: Keluarkan elemen dari kepala barisan dan kembalikan nilainya, seperti LPOP Queue: My-Queue. Memproses Baris kosong: Jika barisan kosong, LPOP mengembalikan nihil, dan anda boleh menyemak sama ada barisan wujud sebelum membaca elemen.

Cara menggunakan perintah redis Apr 10, 2025 pm 08:45 PM

Menggunakan Arahan Redis memerlukan langkah -langkah berikut: Buka klien Redis. Masukkan arahan (nilai kunci kata kerja). Menyediakan parameter yang diperlukan (berbeza dari arahan ke arahan). Tekan Enter untuk melaksanakan arahan. Redis mengembalikan tindak balas yang menunjukkan hasil operasi (biasanya OK atau -r).

Cara menggunakan kunci redis Apr 10, 2025 pm 08:39 PM

Menggunakan REDIS untuk mengunci operasi memerlukan mendapatkan kunci melalui arahan SETNX, dan kemudian menggunakan perintah luput untuk menetapkan masa tamat tempoh. Langkah-langkah khusus adalah: (1) Gunakan arahan SETNX untuk cuba menetapkan pasangan nilai utama; (2) Gunakan perintah luput untuk menetapkan masa tamat tempoh untuk kunci; (3) Gunakan perintah DEL untuk memadam kunci apabila kunci tidak lagi diperlukan.

Cara membaca kod sumber redis Apr 10, 2025 pm 08:27 PM

Cara terbaik untuk memahami kod sumber REDIS adalah dengan langkah demi langkah: Dapatkan akrab dengan asas -asas Redis. Pilih modul atau fungsi tertentu sebagai titik permulaan. Mulakan dengan titik masuk modul atau fungsi dan lihat baris kod mengikut baris. Lihat kod melalui rantaian panggilan fungsi. Berhati -hati dengan struktur data asas yang digunakan oleh REDIS. Kenal pasti algoritma yang digunakan oleh Redis.

Cara menyelesaikan kehilangan data dengan redis Apr 10, 2025 pm 08:24 PM

Kerugian data REDIS termasuk kegagalan memori, gangguan kuasa, kesilapan manusia, dan kegagalan perkakasan. Penyelesaiannya adalah: 1. 2. Salin ke beberapa pelayan untuk ketersediaan tinggi; 3. Ha dengan redis sentinel atau cluster redis; 4. Buat gambar untuk membuat sandaran data; 5. Melaksanakan amalan terbaik seperti kegigihan, replikasi, gambar, pemantauan, dan langkah -langkah keselamatan.

Cara menggunakan baris arahan redis Apr 10, 2025 pm 10:18 PM

Gunakan alat baris perintah redis (redis-cli) untuk mengurus dan mengendalikan redis melalui langkah-langkah berikut: Sambungkan ke pelayan, tentukan alamat dan port. Hantar arahan ke pelayan menggunakan nama arahan dan parameter. Gunakan arahan bantuan untuk melihat maklumat bantuan untuk arahan tertentu. Gunakan perintah berhenti untuk keluar dari alat baris arahan.

See all articles