Bagaimana untuk Mengira Hashes MD5 untuk Fail Besar dalam Python tanpa Memori Lebihan?

Linda Hamilton
Lepaskan: 2024-10-20 10:13:30
asal
779 orang telah melayarinya

How to Calculate MD5 Hashes for Large Files in Python without Memory Overloading?

Mengira Cincang MD5 untuk Fail Besar dalam Python

Pengenalan

Menentukan cincang MD5 bagi fail besar boleh menimbulkan cabaran apabila saiznya melebihi memori yang tersedia. Artikel ini membentangkan penyelesaian praktikal untuk mengira cincang MD5 tanpa memuatkan keseluruhan fail ke dalam memori.

Penyelesaian

Untuk mengira cincang MD5 bagi fail besar, penting untuk membaca mereka dalam ketulan terurus. Coretan kod berikut menunjukkan perkara ini:

<code class="python">def md5_for_file(f, block_size=2**20):
    md5 = hashlib.md5()
    while True:
        data = f.read(block_size)
        if not data:
            break
        md5.update(data)
    return md5.digest()</code>
Salin selepas log masuk

Dengan menyatakan saiz blok yang sesuai, fungsi ini membaca fail dalam ketulan dan terus mengemas kini cincangan MD5 dengan setiap ketul.

Dipertingkatkan Kod

Untuk menyelaraskan proses, pertimbangkan kod dipertingkat berikut:

<code class="python">def generate_file_md5(rootdir, filename, blocksize=2**20):
    m = hashlib.md5()
    with open(os.path.join(rootdir, filename), "rb") as f:
        while True:
            buf = f.read(blocksize)
            if not buf:
                break
            m.update(buf)
    return m.hexdigest()</code>
Salin selepas log masuk

Di sini, fail dibuka dalam mod binari ("rb") untuk mengendalikan data binari dengan betul. Fungsi itu kemudian melelang melalui fail, mengemas kini cincang dan mengembalikan perwakilan heksadesimal cincang akhir.

Hasil Semakan Silang

Untuk memastikan ketepatan, pertimbangkan silang -menyemak keputusan menggunakan alat khusus seperti "jacksum":

jacksum -a md5 <filename>
Salin selepas log masuk

Ini akan memberikan pengiraan cincang MD5 bebas untuk perbandingan.

Atas ialah kandungan terperinci Bagaimana untuk Mengira Hashes MD5 untuk Fail Besar dalam Python tanpa Memori Lebihan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan