Memori Dikongsi dalam Multiprocessing: Membongkar Pengiraan Salin Dalam Tulis dan Rujukan
Latar Belakang
Dalam dunia pemproses berbilang, perkongsian data antara proses membentangkan persoalan penting: sama ada berbilang proses mengakses memori fizikal yang sama atau mengendalikan salinannya. Konsep copy-on-write dalam Linux dan pengiraan rujukan memainkan peranan penting dalam menentukan penggunaan memori bagi proses tersebut.
Tinjauan Keseluruhan Masalah
Dalam senario pelbagai pemprosesan , persoalan timbul sama ada tiga senarai besar (satu mengandungi bitarray dan yang lain mengandungi tatasusunan integer) akan dikongsi antara sub-proses atau disalin untuk setiap satu. Sub-proses hanya memerlukan akses baca kepada senarai, tetapi saiz struktur data yang besar menimbulkan kebimbangan tentang penggunaan memori.
Salin-Tulis dalam Linux
Linux menggunakan pengoptimuman memori copy-on-write. Biasanya, apabila mencipta salinan objek, salinan baharu berkongsi halaman memori fizikal yang sama dengan yang asal. Sebarang perubahan yang dibuat pada salah satu halaman ini mula-mula disalin ke dalam halaman baharu yang eksklusif, memastikan bahawa sebarang pengubahsuaian seterusnya menjejaskan hanya satu entiti. Pengoptimuman ini mengurangkan penggunaan memori dan potensi kerosakan data.
Pengiraan Rujukan
Dalam Python, setiap objek mempunyai kiraan rujukan, yang menjejaki bilangan pembolehubah yang merujuknya. Apabila kiraan rujukan mencecah sifar, objek dipadamkan oleh pemungut sampah.
Walau bagaimanapun, dalam kes berbilang pemprosesan, setiap sub-proses mencipta pembolehubahnya sendiri merujuk senarai dikongsi, dengan berkesan meningkatkan kiraan rujukan. Ini boleh menyebabkan keseluruhan senarai disalin untuk setiap sub-proses, meningkatkan penggunaan memori dengan ketara.
Teka-teki
Walaupun mekanisme salin atas tulis dalam Linux , salah tanggapan yang lazim ialah senarai akan dikongsi antara sub-proses. Walau bagaimanapun, pengiraan rujukan dalam Python memperkenalkan kemungkinan keseluruhan objek disalin.
Penyelesaian: Memori Dikongsi dengan Python 3.8.0
Syukurlah, Python versi 3.8.0 memperkenalkan memori kongsi 'benar', menyediakan mekanisme untuk mencipta memori yang boleh dilihat kepada pelbagai proses tanpa perlu menyalin. Menggunakan modul multiprocessing.shared_memory, pembangun boleh memperuntukkan blok memori yang dikongsi dan mencipta tatasusunan NumPy yang disokong oleh blok ini, membolehkan perkongsian data yang cekap antara proses.
Kesimpulan
Memahami interaksi salin-tulis dan pengiraan rujukan adalah penting dalam senario berbilang pemprosesan. Walaupun Linux mengoptimumkan penggunaan memori, pengiraan rujukan masih boleh menyebabkan penyalinan yang berlebihan. Untuk struktur data yang besar, menggunakan memori kongsi 'benar' yang diperkenalkan dalam Python 3.8.0 menawarkan penyelesaian yang boleh dipercayai untuk perkongsian data yang cekap tanpa overhed penyalinan.
Atas ialah kandungan terperinci Bagaimanakah pengiraan rujukan Python mempengaruhi memori yang dikongsi dalam berbilang pemprosesan, dengan mengambil kira mekanisme salin atas tulis Linux?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!