Menentukan Kiraan Baris Fail Ekstensif dalam Python dengan Kecekapan Dipertingkat
Mengira baris dalam fail besar memberikan cabaran dari segi memori dan masa penggunaan. Artikel ini menawarkan pendekatan yang dioptimumkan untuk menangani isu ini, menyediakan penyelesaian untuk pengiraan baris sambil meminimumkan penggunaan sumber.
Pendekatan Cekap Memori
Kaedah konvensional, seperti yang ditunjukkan oleh kod yang disediakan, menghitung baris dalam fail, mengiranya secara berurutan. Walaupun berfungsi, pendekatan ini memerlukan lelaran ke atas keseluruhan fail dalam ingatan, menggunakan sumber memori yang ketara.
Pendekatan Lebih Pantas dengan Penjumlahan
Pendekatan yang lebih pantas melibatkan penggunaan ungkapan penjana untuk mengira baris secara terus. Coretan kod berikut menunjukkan kaedah ini:
num_lines = sum(1 for _ in open('myfile.txt'))
Pendekatan ini beroperasi dengan mengulangi fail satu baris pada satu masa, menambah pembilang untuk setiap baris yang ditemui. Memandangkan ungkapan penjana hanya menghasilkan satu baris pada satu masa, ia menghapuskan penggunaan memori yang berlebihan.
Penggalak Prestasi dengan Bacaan Buffered
Untuk meningkatkan lagi kelajuan dan keteguhan, memanfaatkan penimbal bacaan disyorkan:
with open("myfile.txt", "rbU") as f: num_lines = sum(1 for _ in f)
Bacaan buffer mengoptimumkan akses fail dengan mengambil data dalam ketulan yang lebih besar, mengurangkan overhed operasi fail berulang. Walau bagaimanapun, sila ambil perhatian bahawa aksara 'U' dalam mod "rbU" sudah lapuk sejak Python 3.3, jadi "rb" harus digunakan sebaliknya (dialih keluar dalam Python 3.11).
Dengan menggunakan teknik ini, anda boleh dengan cekap kira baris dalam fail besar sambil menjimatkan memori dan meminimumkan masa pelaksanaan.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengira Baris dengan Cekap dalam Fail Besar Menggunakan Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!