Pemprosesan berbilang dalam Python membolehkan anda mencipta berbilang proses yang berjalan serentak, membolehkan anda memanfaatkan berbilang teras dan meningkatkan prestasi. Walau bagaimanapun, berkongsi sejumlah besar data antara proses boleh menjadi kebimbangan. Di sini, kita membincangkan gelagat memori dikongsi apabila menggunakan pelbagai pemprosesan untuk mengendalikan senarai besar objek berbeza.
Secara amnya, Python menggunakan semantik copy-on-write (COW) apabila mencipta proses baharu. Ini bermakna apabila proses baharu dicipta, ia berkongsi memori yang sama dengan proses induk. Sebarang pengubahsuaian yang dibuat oleh mana-mana proses akan mencipta salinan baharu kawasan memori yang terjejas. Walau bagaimanapun, mengakses objek kongsi akan menambah kiraan rujukannya, menimbulkan kebimbangan tentang kemungkinan memori disalin disebabkan pengiraan rujukan.
Dalam contoh yang disediakan, di mana tiga senarai besar yang mengandungi bitarray dan tatasusunan integer dikongsi antara berbilang subproses, mekanisme pengiraan rujukan sememangnya boleh membawa kepada keseluruhan objek disalin. Ini kerana fungsi someFunction mengakses setiap senarai, menambah bilangan rujukannya. Memandangkan senarai adalah besar, penggunaan memori akan meningkat dengan ketara dengan setiap subproses.
Untuk mengelakkan pertindihan data kongsi yang tidak perlu, seperti senarai besar dalam kes ini , anda perlu merangka mekanisme untuk melumpuhkan pengiraan rujukan untuk senarai ini dan objek konstituennya. Walau bagaimanapun, dokumentasi Python menasihatkan supaya tidak mengubah suai pengiraan rujukan, kerana ia merupakan bahagian asas sistem pengurusan memori Python.
Penyelesaian yang mungkin untuk memastikan integriti data semasa berkongsinya antara subproses adalah menggunakan Memori Dikongsi Benar. Diperkenalkan dalam Python versi 3.8, True Shared Memory membolehkan anda mencipta objek memori kongsi yang boleh diakses terus daripada semua subproses tanpa menduplikasi data.
Contoh kod yang disediakan menunjukkan penggunaan True Shared Memory dengan tatasusunan NumPy, kes penggunaan biasa. Fungsi add_one menggunakan tatasusunan NumPy sedia ada yang disokong oleh memori yang dikongsi (dicipta dalam fungsi create_shared_block) untuk melakukan pengiraan tanpa menyalin keseluruhan tatasusunan. Cetakan tatasusunan Akhir menunjukkan tatasusunan yang dikemas kini, mengesahkan bahawa perubahan yang dibuat dalam subproses ditunjukkan dalam memori yang dikongsi.
Berkongsi sejumlah besar data antara berbilang subproses menggunakan berbilang pemprosesan boleh menjadi mencabar kerana mekanisme pengiraan rujukan yang wujud. Walau bagaimanapun, dengan kemunculan True Shared Memory, anda boleh mengatasi had ini dan memastikan integriti data sambil memanfaatkan faedah selari.
Atas ialah kandungan terperinci Bagaimanakah anda boleh memastikan integriti data apabila berkongsi senarai besar objek merentasi pelbagai subproses menggunakan pelbagai pemprosesan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!