Pada dasarnya, Python ialah bahasa linear, tetapi modul penjalinan amat berguna apabila anda memerlukan lebih banyak kuasa pemprosesan. Walaupun benang dalam Python tidak boleh digunakan untuk pengkomputeran CPU selari, ia sangat sesuai untuk operasi I/O seperti mengikis web kerana pemproses melahu, menunggu data.
Benang sedang mengubah permainan kerana banyak skrip berkaitan I/O rangkaian/data menghabiskan sebahagian besar masa mereka menunggu data daripada sumber jauh. Memandangkan muat turun mungkin dinyahpautkan (iaitu merangkak tapak web berasingan), pemproses boleh memuat turun daripada sumber data yang berbeza secara selari dan menggabungkan hasilnya pada penghujungnya. Untuk proses intensif CPU, terdapat sedikit faedah untuk menggunakan modul benang.
Mujurlah, urutan disertakan dalam pustaka standard:
import threading from queue import Queue import time
Anda boleh menggunakan target
sebagai boleh panggil dan args
untuk menghantar hujah Lulus ke fungsi dan start
mulakan utas.
def testThread(num): print num if __name__ == '__main__': for i in range(5): t = threading.Thread(target=testThread, arg=(i,)) t.start()
Jika anda tidak pernah melihat if __name__ == '__main__':
sebelum ini, ini pada asasnya adalah cara untuk memastikan kod yang bersarang di dalamnya hanya berjalan apabila skrip dijalankan secara langsung (berbanding dengan diimport).
Benang proses sistem pengendalian yang sama mengedarkan beban kerja pengkomputeran merentas berbilang teras, seperti yang dilihat dalam bahasa pengaturcaraan seperti C++ dan Java. Biasanya, python hanya menggunakan satu proses, dari mana benang utama dihasilkan untuk melaksanakan runtime. Ia kekal pada teras tunggal tanpa mengira berapa banyak teras yang ada pada komputer atau berapa banyak utas baharu yang dihasilkan disebabkan oleh mekanisme penguncian yang dipanggil kunci penterjemah global Untuk mengelakkan apa yang dipanggil keadaan perlumbaan.
Apabila bercakap tentang persaingan, saya memikirkan NASCAR dan Formula Satu. Mari kita gunakan analogi ini dan bayangkan semua pemandu Formula 1 cuba berlumba dalam satu kereta pada masa yang sama. Kedengaran tidak masuk akal, bukan? , yang hanya boleh dilakukan jika setiap pemandu mempunyai akses kepada keretanya sendiri, atau lebih baik lagi, berlari satu pusingan pada satu masa, menyerahkan kereta itu kepada pemandu seterusnya setiap kali.
Ini sangat serupa dengan apa yang berlaku dalam urutan. Benang "bercabang" daripada benang "utama", dan setiap utas berikutnya ialah salinan benang sebelumnya. Utas ini semuanya wujud dalam "konteks" proses yang sama (acara atau perlumbaan), jadi semua sumber (seperti ingatan) yang diperuntukkan kepada proses dikongsi. Contohnya, dalam sesi penterjemah python biasa:
>>> a = 8
Di sini,
menggunakan sangat sedikit memori (RAM) dengan menahan nilai 8 buat sementara waktu di beberapa lokasi sewenang-wenangnya dalam ingatan.a
Setakat ini, mari kita mulakan beberapa utas dan amati gelagat mereka apabila menambah dua nombor
: x
import time import threading from threading import Thread a = 8 def threaded_add(x, y): # simulation of a more complex task by asking # python to sleep, since adding happens so quick! for i in range(2): global a print("computing task in a different thread!") time.sleep(1) #this is not okay! but python will force sync, more on that later! a = 10 print(a) # the current thread will be a subset fork! if __name__ != "__main__": current_thread = threading.current_thread() # here we tell python from the main # thread of execution make others if __name__ == "__main__": thread = Thread(target = threaded_add, args = (1, 2)) thread.start() thread.join() print(a) print("main thread finished...exiting")
>>> computing task in a different thread! >>> 10 >>> computing task in a different thread! >>> 10 >>> 10 >>> main thread finished...exiting
Kedua-dua utas sedang berjalan. Mari kita panggil mereka dan . Jika thread_one
mahu mengubah suai thread_two
dengan nilai 10, dan thread_one
pada masa yang sama cuba mengemas kini pembolehubah yang sama, kami menghadapi masalah! Situasi yang dipanggil perlumbaan data akan berlaku dan nilai a
yang terhasil akan menjadi tidak konsisten. thread_two
Acara perlumbaan yang anda tidak tonton, tetapi mendengar dua keputusan bercanggah daripada dua rakan anda!
menyangkal perkara ini! Berikut ialah coretan pseudokod untuk menggambarkan: thread_one
a = 8 # spawns two different threads 1 and 2 # thread_one updates the value of a to 10 if (a == 10): # a check #thread_two updates the value of a to 15 a = 15 b = a * 2 # if thread_one finished first the result will be 20 # if thread_two finished first the result will be 30 # who is right?
thread two
Apa yang sedang berlaku? CPython ialah penterjemah yang menyediakan antara muka fungsi luaran dengan C dan bahasa pengaturcaraan lain Ia menyusun kod sumber python ke dalam kod bait perantaraan, yang ditafsirkan oleh mesin maya CPython. Perbincangan setakat ini dan pada masa hadapan adalah mengenai CPython dan memahami tingkah laku dalam persekitaran.
import sys import gc hello = "world" #reference to 'world' is 2 print (sys.getrefcount(hello)) bye = "world" other_bye = bye print(sys.getrefcount(bye)) print(gc.get_referrers(other_bye))
>>> 4 >>> 6 >>> [['sys', 'gc', 'hello', 'world', 'print', 'sys', 'getrefcount', 'hello', 'bye', 'world', 'other_bye', 'bye', 'print', 'sys', 'getrefcount', 'bye', 'print', 'gc', 'get_referrers', 'other_bye'], (0, None, 'world'), {'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <_frozen_importlib_external.sourcefileloader>, '__spec__': None, '__annotations__': {}, '__builtins__': <module>, '__file__': '', '__cached__': None, 'sys': <module>, 'gc': <module>, 'hello': 'world', 'bye': 'world', 'other_bye': 'world'}]</module></module></module></_frozen_importlib_external.sourcefileloader>
CPython 的 GIL 通过一次允许一个线程控制解释器来控制 Python 解释器。它为单线程程序提供了性能提升,因为只需要管理一个锁,但代价是它阻止了多线程 CPython 程序在某些情况下充分利用多处理器系统。
import time, os from threading import Thread, current_thread from multiprocessing import current_process COUNT = 200000000 SLEEP = 10 def io_bound(sec): pid = os.getpid() threadName = current_thread().name processName = current_process().name print(f"{pid} * {processName} * {threadName} \ ---> Start sleeping...") time.sleep(sec) print(f"{pid} * {processName} * {threadName} \ ---> Finished sleeping...") def cpu_bound(n): pid = os.getpid() threadName = current_thread().name processName = current_process().name print(f"{pid} * {processName} * {threadName} \ ---> Start counting...") while n>0: n -= 1 print(f"{pid} * {processName} * {threadName} \ ---> Finished counting...") def timeit(function,args,threaded=False): start = time.time() if threaded: t1 = Thread(target = function, args =(args, )) t2 = Thread(target = function, args =(args, )) t1.start() t2.start() t1.join() t2.join() else: function(args) end = time.time() print('Time taken in seconds for running {} on Argument {} is {}s -{}'.format(function,args,end - start,"Threaded" if threaded else "None Threaded")) if __name__=="__main__": #Running io_bound task print("IO BOUND TASK NON THREADED") timeit(io_bound,SLEEP) print("IO BOUND TASK THREADED") #Running io_bound task in Thread timeit(io_bound,SLEEP,threaded=True) print("CPU BOUND TASK NON THREADED") #Running cpu_bound task timeit(cpu_bound,COUNT) print("CPU BOUND TASK THREADED") #Running cpu_bound task in Thread timeit(cpu_bound,COUNT,threaded=True)
>>> IO BOUND TASK NON THREADED >>> 17244 * MainProcess * MainThread ---> Start sleeping... >>> 17244 * MainProcess * MainThread ---> Finished sleeping... >>> 17244 * MainProcess * MainThread ---> Start sleeping... >>> 17244 * MainProcess * MainThread ---> Finished sleeping... >>> Time taken in seconds for running <function> on Argument 10 is 20.036664724349976s -None Threaded >>> IO BOUND TASK THREADED >>> 10180 * MainProcess * Thread-1 ---> Start sleeping... >>> 10180 * MainProcess * Thread-2 ---> Start sleeping... >>> 10180 * MainProcess * Thread-1 ---> Finished sleeping... >>> 10180 * MainProcess * Thread-2 ---> Finished sleeping... >>> Time taken in seconds for running <function> on Argument 10 is 10.01464056968689s -Threaded >>> CPU BOUND TASK NON THREADED >>> 14172 * MainProcess * MainThread ---> Start counting... >>> 14172 * MainProcess * MainThread ---> Finished counting... >>> 14172 * MainProcess * MainThread ---> Start counting... >>> 14172 * MainProcess * MainThread ---> Finished counting... >>> Time taken in seconds for running <function> on Argument 200000000 is 44.90199875831604s -None Threaded >>> CPU BOUND TASK THEADED >>> 15616 * MainProcess * Thread-1 ---> Start counting... >>> 15616 * MainProcess * Thread-2 ---> Start counting... >>> 15616 * MainProcess * Thread-1 ---> Finished counting... >>> 15616 * MainProcess * Thread-2 ---> Finished counting... >>> Time taken in seconds for running <function> on Argument 200000000 is 106.09711360931396s -Threaded</function></function></function></function>
import os import time from multiprocessing import Process, current_process SLEEP = 10 COUNT = 200000000 def count_down(cnt): pid = os.getpid() processName = current_process().name print(f"{pid} * {processName} \ ---> Start counting...") while cnt > 0: cnt -= 1 def io_bound(sec): pid = os.getpid() threadName = current_thread().name processName = current_process().name print(f"{pid} * {processName} * {threadName} \ ---> Start sleeping...") time.sleep(sec) print(f"{pid} * {processName} * {threadName} \ ---> Finished sleeping...") if __name__ == '__main__': # creating processes start = time.time() #CPU BOUND p1 = Process(target=count_down, args=(COUNT, )) p2 = Process(target=count_down, args=(COUNT, )) #IO BOUND #p1 = Process(target=, args=(SLEEP, )) #p2 = Process(target=count_down, args=(SLEEP, )) # starting process_thread p1.start() p2.start() # wait until finished p1.join() p2.join() stop = time.time() elapsed = stop - start print ("The time taken in seconds is :", elapsed)
>>> 1660 * Process-2 ---> Start counting... >>> 10184 * Process-1 ---> Start counting... >>> The time taken in seconds is : 12.815475225448608
import time import asyncio COUNT = 200000000 # asynchronous function defination async def func_name(cnt): while cnt > 0: cnt -= 1 #asynchronous main function defination async def main (): # Creating 2 tasks.....You could create as many tasks (n tasks) task1 = loop.create_task(func_name(COUNT)) task2 = loop.create_task(func_name(COUNT)) # await each task to execute before handing control back to the program await asyncio.wait([task1, task2]) if __name__ =='__main__': # get the event loop start_time = time.time() loop = asyncio.get_event_loop() # run all tasks in the event loop until completion loop.run_until_complete(main()) loop.close() print("--- %s seconds ---" % (time.time() - start_time))
>>> --- 41.74118399620056 seconds ---
数据在进程之间混洗会产生 I/O 开销
Atas ialah kandungan terperinci Apakah Python multithreading dan cara menggunakannya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!