Keserasian cincang Murmur3 antara Go dan Python

王林
Lepaskan: 2024-02-09 13:10:19
ke hadapan
1163 orang telah melayarinya

Go 和 Python 之间的 Murmur3 哈希兼容性

editor php Zimo memperkenalkan anda kepada keserasian cincang Murmur3 antara Go dan Python. Murmur3 ialah algoritma cincang cekap yang biasa digunakan untuk operasi cincang dalam struktur data dan algoritma. Algoritma pencincangan Murmur3 dilaksanakan secara berbeza dalam dua bahasa pengaturcaraan Go dan Python, jadi isu keserasian mungkin timbul apabila menggunakannya. Artikel ini akan memperincikan perbezaan dalam algoritma pencincangan Murmur3 dalam Go dan Python serta menyediakan penyelesaian untuk memastikan keserasian cincang yang betul apabila menghantar data antara bahasa yang berbeza.

Kandungan soalan

Kami mempunyai dua perpustakaan berbeza, satu dalam ular sawa dan satu lagi, yang perlu mengira cincang murmur3 dengan cara yang sama. Malangnya, tidak kira betapa sukarnya kami mencuba, kami tidak dapat memastikan perpustakaan menghasilkan hasil yang sama. Berdasarkan soalan ini tentang java dan python, keserasian tidak semestinya mudah.

Kini kami menggunakan python mmh3 dan pergi ke perpustakaan github.com/spaolacci/murmur3.

dalam perjalanan:

hash := murmur3.new128()
hash.write([]byte("chocolate-covered-espresso-beans"))
fmt.println(base64.rawurlencoding.encodetostring(hash.sum(nil)))
// output: clhso2ncbxyoezvilm5gwg
Salin selepas log masuk

Dalam ular sawa:

name = "chocolate-covered-espresso-beans"
hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='big', signed=False)
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# Output: jns74izOYMJwsdKjacIHHA (big byteorder)

hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='little', signed=False)
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# Output: HAfCaaPSsXDCYM4s4jt7jg (little byteorder)

hash = mmh3.hash_bytes(name.encode('utf-8'))
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# Output: HAfCaaPSsXDCYM4s4jt7jg
Salin selepas log masuk

In go, murmur3返回一个uint64,所以我们假设python中的signed=false;但是我们也尝试了 signed=true tidak mendapat nilai cincang yang sepadan.

Kami terbuka kepada perpustakaan yang berbeza, tetapi ingin mengetahui sama ada terdapat masalah dengan pendekatan go atau python kami untuk mengira cincangan yang dikodkan base64 daripada rentetan. Sebarang bantuan amat dihargai.

Penyelesaian

Hasil python pertama hampir betul.

>>> binascii.hexlify(base64.b64decode('jns74izoymjwsdkjacihha=='))
b'8e7b3be22cce60c270b1d2a369c2071c'
Salin selepas log masuk

dalam perjalanan:

    x, y := murmur3.sum128([]byte("chocolate-covered-espresso-beans"))
    fmt.printf("%x %x\n", x, y)
Salin selepas log masuk

Hasil:

70b1d2a369c2071c 8e7b3be22cce60c2
Salin selepas log masuk

Jadi susunan kedua-dua perkataan ini terbalik. Untuk mendapatkan hasil yang sama dalam python anda boleh mencuba ini:

name = "chocolate-covered-espresso-beans"
hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='big', signed=False)
hash = hash[8:] + hash[:8]
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# cLHSo2nCBxyOezviLM5gwg
Salin selepas log masuk

Atas ialah kandungan terperinci Keserasian cincang Murmur3 antara Go dan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:stackoverflow.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!