Le contenu de cet article est une introduction détaillée (exemple de code) sur le multi-processus en Python. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer.
Cette section parle de l'apprentissage du multi-processus de Python.
Multi-processus Multiprocessing
est similaire au multi-threading Ils sont tous deux utilisés pour les opérations 并行
en python. qu'il y a du threading, pourquoi Python a-t-il un multitraitement ? La raison est très simple, c'est pour compenser certains inconvénients du threading, comme mentionné dans le tutoriel sur le threading GIL
.
Utiliser le multitraitement est. C'est aussi très simple. Amis qui ont une certaine compréhension, votre moment est venu d'en profiter. Parce que python rend l'utilisation du multitraitement et du threading presque la même, cela nous permet également de démarrer plus facilement. le système multicœur de votre ordinateur !
import multiprocessing as mp import threading as td def job(a,d): print('aaaaa') t1 = td.Thread(target=job,args=(1,2)) p1 = mp.Process(target=job,args=(1,2)) t1.start() p1.start() t1.join() p1.join()
Comme le montre le code de comparaison d'utilisation ci-dessus, les threads et les processus sont utilisés de manière similaire.
, vous devez ajouter une instruction définissant la fonction principale
if __name__=='__main__':
Code d'application complet :
# -*- coding:utf-8 -*- """ @author: Corwien @file: process_test.py @time: 18/8/26 01:12 """ import multiprocessing as mp def job(a, d): print a, d if __name__ == '__main__': p1 = mp.Process(target=job, args=(1, 2)) p1.start() p1.join()
Environnement d'exécution Dans un Dans l'environnement du terminal, d'autres outils d'édition peuvent ne pas imprimer les résultats après l'exécution. Les résultats imprimés après l'exécution dans le terminal sont :
➜ baseLearn python ./process/process_test.py 1 2 ➜ baseLearn
La fonction de la file d'attente est de placez les résultats de l'opération de chaque cœur ou thread dans la file d'attente, attendez que chaque thread ou cœur ait fini de s'exécuter, puis retirez les résultats de la file d'attente et continuez à charger l'opération. La raison est très simple. Les fonctions appelées par plusieurs threads ne peuvent pas avoir de valeur de retour, donc la file d'attente est utilisée pour stocker les résultats de plusieurs opérations de thread
process_queue.py
# -*- coding:utf-8 -*- """ @author: Corwien @file: process_queue.py @time: 18/8/26 01:12 """ import multiprocessing as mp # 定义一个被多线程调用的函数,q 就像一个队列,用来保存每次函数运行的结果 def job(q): res = 0 for i in range(1000): res += i + i**2 + i**3 q.put(res) #queue if __name__ == '__main__': q = mp.Queue() p1 = mp.Process(target=job, args=(q,)) p2 = mp.Process(target=job, args=(q,)) # 分别启动、连接两个线程 p1.start() p2.start() p1.join() p2.join() # 上面是分两批处理的,所以这里分两批输出,将结果分别保存 res1 = q.get() res2 = q.get() print res1,res2
Imprimer la sortie. résultat :
➜ python ./process/process_queue.py 249833583000 249833583000
进程池
signifie que nous mettons les choses que nous voulons exécuter dans le pool, Python会自行解决多进程的问题
.
Tout d'abord import multiprocessing
et définissez job()
import multiprocessing as mp def job(x): return x*x
Pool
pool = mp.Pool()
et le précédent Pool
est que la fonction lancée au Pool par Process的
a une valeur de retour , tandis que le de Process
n'a pas de valeur de retour .
pour obtenir le résultat. Dans map()
, vous devez mettre la fonction et la valeur qui doit être itérée. Ensuite, elle sera automatiquement attribuée au cœur du CPU et renverra le. résultat map()
res = pool.map(job, range(10))
def multicore(): pool = mp.Pool() res = pool.map(job, range(10)) print(res) if __name__ == '__main__': multicore()
# -*- coding:utf-8 -*- """ @author: Corwien @file: process_queue.py @time: 18/8/26 01:12 """ import multiprocessing as mp def job(x): return x*x # 注意这里的函数有return返回值 def multicore(): pool = mp.Pool() res = pool.map(job, range(10)) print(res) if __name__ == '__main__': multicore()
➜ baseLearn python ./process/process_pool.py [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
appelle réellement plusieurs cœurs ? Nous pouvons augmenter le nombre d'itérations, puis ouvrir la charge CPU pour voir le fonctionnement du CPUPool
dans Pool
processes
def multicore(): pool = mp.Pool(processes=3) # 定义CPU核数量为3 res = pool.map(job, range(10)) print(res)
, il existe une autre façon de renvoyer des résultats, c'est-à-dire Pool
.map()
apply_async()
ne peut transmettre qu'une seule valeur, elle n'est qu'A core sera mis en service, mais lors du passage de la valeur, veuillez noter qu'elle est itérable, vous devez donc ajouter une virgule après la valeur transmise, et vous devez utiliser la méthode get() pour obtenir la valeur de retour apply_async()
def multicore(): pool = mp.Pool() res = pool.map(job, range(10)) print(res) res = pool.apply_async(job, (2,)) # 用get获得结果 print(res.get())
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] # map() 4 # apply_async()
Pool
map()
apply_async()
只有用共享内存才能让CPU之间有交流
Valeur partagée
Value
import multiprocessing as mp value1 = mp.Value('i', 0) value2 = mp.Value('d', 3.14)
sont utilisés pour définir le type de données d
représente un double de type à virgule flottante double précision, et i
représente un d
signé. i
Type code | C Type | Python Type | Minimum size in bytes |
---|---|---|---|
'b' |
signed char | int | 1 |
'B' |
unsigned char | int | 1 |
'u' |
Py_UNICODE | Unicode character | 2 |
'h' |
signed short | int | 2 |
'H' |
unsigned short | int | 2 |
'i' |
signed int | int | 2 |
'I' |
unsigned int | int | 2 |
'l' |
signed long | int | 4 |
'L' |
unsigned long | int | 4 |
'q' |
signed long long | int | 8 |
'Q' |
unsigned long long | int | 8 |
'f' |
float | float | 4 |
'd' |
double | float | 8 |
在Python的 mutiprocessing
中,有还有一个Array
类,可以和共享内存交互,来实现在进程之间共享数据。
array = mp.Array('i', [1, 2, 3, 4])
这里的Array
和numpy中的不同,它只能是一维
的,不能是多维的。同样和Value
一样,需要定义数据形式,否则会报错。 我们会在后一节举例说明这两种的使用方法.
错误形式
array = mp.Array('i', [[1, 2], [3, 4]]) # 2维list """ TypeError: an integer is required """
让我们看看没有加进程锁时会产生什么样的结果。
# -*- coding:utf-8 -*- """ @author: Corwien @file: process_no_lock.py @time: 18/8/26 09:22 """ import multiprocessing as mp import time def job(v, num): for _ in range(5): time.sleep(0.5) # 暂停0.5秒,让输出效果更明显 v.value += num # v.value获取共享变量值 print(v.value) def multicore(): v = mp.Value('i', 0) # 定义共享变量 p1 = mp.Process(target=job, args=(v, 1)) p2 = mp.Process(target=job, args=(v, 4)) # 设定不同的number看如何抢夺内存 p1.start() p2.start() p1.join() p2.join() if __name__ == '__main__': multicore()
在上面的代码中,我们定义了一个共享变量v
,两个进程都可以对它进行操作。 在job()中我们想让v
每隔0.1秒输出一次累加num
的结果,但是在两个进程p1
和p2
中设定了不同的累加值。所以接下来让我们来看下这两个进程是否会出现冲突。
结果打印:
➜ baseLearn python ./process/process_no_lock.py 1 5 9 9 13 13 17 17 18 18 ➜ baseLearn
我们可以看到,进程1和进程2在相互抢
着使用共享内存v
。
为了解决上述不同进程抢共享资源的问题,我们可以用加进程锁来解决。
首先需要定义一个进程锁
l = mp.Lock() # 定义一个进程锁
然后将进程锁的信息传入各个进程中
p1 = mp.Process(target=job, args=(v,1,l)) # 需要将Lock传入 p2 = mp.Process(target=job, args=(v,3,l))
在job()
中设置进程锁的使用,保证运行时一个进程的对锁内内容的独占
def job(v, num, l): l.acquire() # 锁住 for _ in range(5): time.sleep(0.1) v.value += num # v.value获取共享内存 print(v.value) l.release() # 释放
全部代码:
# -*- coding:utf-8 -*- """ @author: Corwien @file: process_lock.py @time: 18/8/26 09:22 """ import multiprocessing as mp import time def job(v, num, l): l.acquire() # 锁住 for _ in range(5): time.sleep(0.5) # 暂停0.5秒,让输出效果更明显 v.value += num # v.value获取共享变量值 print(v.value) l.release() # 释放 def multicore(): l = mp.Lock() # 定义一个进程锁 v = mp.Value('i', 0) # 定义共享变量 p1 = mp.Process(target=job, args=(v, 1, l)) # 需要将lock传入 p2 = mp.Process(target=job, args=(v, 4, l)) # 设定不同的number看如何抢夺内存 p1.start() p2.start() p1.join() p2.join() if __name__ == '__main__': multicore()
运行一下,让我们看看是否还会出现抢占资源的情况:
结果打印:
➜ baseLearn python ./process/process_lock.py 1 2 3 4 5 9 13 17 21 25
显然,进程锁保证了进程p1
的完整运行,然后才进行了进程p2
的运行
相关推荐:
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!