Pythonマルチプロセスの適用方法-Python チュートリアル-php.cn

並列およびシリアルコンピューティング

並列プログラミングモデル

Python マルチプロセスの開始

CPU 集中型のタスクを処理するために複数のプロセスを作成する必要がある場合はどうすればよいでしょうか?常に明示的に開始して終了を待つ必要があるのでしょうか?ここでの解決策は、

joblib

充分利用 Python多进程

ホームページ

バックエンド開発

Python チュートリアル

Pythonマルチプロセスの適用方法

PHPz

May 25, 2023 am 09:28 AM

python

並列およびシリアルコンピューティング

解決すべき大きな問題があり、あなたが一人であると想像してください。 8 つの異なる数値の平方根を計算する必要があります。職業はなんですか？あまり選択肢はありません。最初の数値から始めて結果を計算します。それから他の人に移ります。

数学が得意で喜んで手伝ってくれる友達が 3 人いる場合はどうしますか?それぞれが 2 つの数値の平方根を計算し、仕事量が友人間で均等に分散されるため、仕事が簡単になります。これは、問題がより早く解決されることを意味します。

わかりました、すべて分かりましたか?これらの例では、各フレンドは CPU のコアを表します。最初の例では、タスク全体が順番に解決されます。これは シリアル計算 と呼ばれます。 2 番目の例では、合計 4 つのコアを使用しているため、Parallel Computing を使用しています。並列コンピューティングには、並列プロセス、またはプロセッサの複数のコアに分割されたプロセスの使用が含まれます。

Pythonマルチプロセスの適用方法

並列プログラミングモデル

並列プログラミングとは何かを確立しましたが、それをどのように使用するのでしょうか?並列コンピューティングには、プロセッサの複数のコアにわたって複数のタスクを実行することが含まれると前に説明しました。これは、これらのタスクが同時に実行されることを意味します。並列化を進める前に、いくつかの問題を考慮する必要があります。たとえば、計算を高速化できる他の最適化はありますか?

さて、並列化が最適なソリューションであることは当然のことだと考えましょう。並列コンピューティングには 3 つの主なモードがあります:

完全並列 。タスクは独立して実行でき、相互に通信する必要はありません。
共有メモリ並列。プロセス (またはスレッド) は通信する必要があるため、グローバルアドレス空間を共有します。
#メッセージの受け渡し。プロセスは必要に応じてメッセージを共有する必要があります。

この記事では、最も単純でもある最初のモデルについて説明します。

Python マルチプロセッシング: Python のプロセスベースの並列処理

Python で並列処理を実現する 1 つの方法は、

multiprocessing モジュールを使用することです。 multiprocessing このモジュールを使用すると、それぞれに独自の Python インタープリターを備えた複数のプロセスを作成できます。したがって、Python マルチプロセッシングはプロセスベースの並列処理を実装します。

同じく Python に組み込まれている

threading などの他のライブラリについて聞いたことがあるかもしれませんが、それらの間には重要な違いがあります。 multiprocessing モジュールは新しいプロセスを作成し、threading は新しいスレッドを作成します。

マルチプロセスを使用する利点

「なぜマルチプロセスを選択するのですか?」と疑問に思われるかもしれません。マルチプロセスは、複数のタスクを順次ではなく並行して実行することにより、プログラムの効率を大幅に向上させることができます。。似た用語にマルチスレッドがありますが、それらは異なります。

プロセスはメモリにロードされるプログラムであり、他のプロセスとメモリを共有しません。スレッドはプロセス内の実行単位です。複数のスレッドがプロセス内で実行され、プロセスのメモリ空間を相互に共有します。

Python のグローバルインタープリターロック (GIL) では、インタープリターの下で一度に 1 つのスレッドしか実行できません。つまり、Python インタープリターが必要な場合は、マルチスレッドのパフォーマンス上の利点を享受できません。これが、Python でスレッド処理よりもマルチ処理の方が有利である理由です。各プロセスには、割り当てられた命令を実行する独自のインタプリタがあるため、複数のプロセスを並行して実行できます。さらに、オペレーティングシステムはプログラムを複数のプロセスで調べて個別にスケジュールします。つまり、プログラムがコンピュータリソース全体のより大きなシェアを占めることになります。したがって、プログラムが CPU バウンドである場合、マルチ処理は高速になります。プログラム内に大量の I/O がある状況では、ほとんどの時間、プログラムは I/O が完了するのを待機しているため、スレッドの方が効率的である可能性があります。ただし、複数のプロセスは同時に実行されるため、通常はより効率的です。

マルチプロセッシングの利点は次のとおりです:

CPU を大量に使用するタスクを処理する際の CPU の使用効率の向上
スレッドと比較して、子スレッドに対する制御が強化されています
コーディングが簡単

最初の利点はパフォーマンスに関連しています。マルチプロセッシングでは新しいプロセスが作成されるため、タスクを他のコア間で分割することで CPU の計算能力をより有効に活用できます。最近のほとんどのプロセッサはマルチコアであり、コードを最適化すれば、並列コンピューティングによって時間を節約できます。

2 番目の利点は、マルチスレッドの代替手段です。スレッドはプロセスではないため、これには影響があります。スレッドを作成した場合、通常のプロセスと同様にスレッドを終了したり、中断したりすることは危険です。マルチプロセッシングとマルチスレッドの比較はこの記事の範囲を超えているため、マルチプロセッシングとマルチスレッドの違いについては、後で別の記事を書きます。

マルチプロセッシングの 3 番目の利点は、処理しようとしているタスクが並列プログラミングに適しているため、実装が簡単であることです。

Python マルチプロセスの開始

いよいよ Python コードを作成する準備が整いました。

Python マルチプロセッシングの中核的な側面を説明するために使用する非常に基本的な例から始めます。この例では、

parentoften という 2 つのプロセスがあります。親プロセスは 1 つだけあり、複数の子プロセスを持つことができます。
#子プロセス。これは親プロセスによって生成されます。各子プロセスは新しい子プロセスを持つこともできます。

child プロシージャを使用して特定の関数を実行します。このようにして、parent は実行を継続できます。

簡単な Python マルチプロセスの例

この例で使用するコードは次のとおりです:

from multiprocessing import Process

def bubble_sort(array):
    check = True
    while check == True:
      check = False
      for i in range(0, len(array)-1):
        if array[i] > array[i+1]:
          check = True
          temp = array[i]
          array[i] = array[i+1]
          array[i+1] = temp
    print("Array sorted: ", array)

if __name__ == '__main__':
    p = Process(target=bubble_sort, args=([1,9,4,5,2,6,8,4],))
    p.start()
    p.join()

ログイン後にコピー

このスニペットでは、

bubble_sort という名前のプロセスを定義します。（配列）＃＃＃。この関数は、バブルソートアルゴリズムの非常に単純な実装です。それが何であるか分からなくても、重要ではないので心配しないでください。知っておくべき重要なことは、これは何かを行う関数であるということです。プロセスクラス

multiprocessing

から、クラス Process をインポートします。このクラスは、別のプロセスで実行されるアクティビティを表します。実際、いくつかのパラメータを渡していることがわかります:

target=bubble_sort
これは、新しいプロセスがその bubble_sort を実行することを意味します。 Function
args=([1,9,4,52,6,8,4],)
、これはターゲット関数にパラメータとして渡されます

p.start()

を記述することで実行されます。この時点でプロセスが始まります。終了する前に、子プロセスが計算を完了するまで待つ必要があります。

join()

メソッドはプロセスが終了するまで待機します。この例では、子プロセスを 1 つだけ作成します。ご想像のとおり、

Process

クラスでインスタンスをさらに作成することで、さらに多くの子プロセスを作成できます。プロセスプールクラス

CPU 集中型のタスクを処理するために複数のプロセスを作成する必要がある場合はどうすればよいでしょうか?常に明示的に開始して終了を待つ必要があるのでしょうか?ここでの解決策は、

Pool

クラスを使用することです。

Pool

クラスを使用すると、ワーカープロセスのプールを作成できます。次の例では、その使用方法を見ていきます。新しい例は次のとおりです。 <div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">from multiprocessing import Pool import time import math N = 5000000 def cube(x): return math.sqrt(x) if __name__ == "__main__": with Pool() as pool: result = pool.map(cube, range(10,N)) print("Program finished!")</pre><div class="contentsignin">ログイン後にコピー</div></div> このコードスニペットには、整数だけを受け取り、その平方根を返す

cube(x)

関数があります。とてもシンプルですよね？次に、プロパティを指定せずに

Pool

クラスのインスタンスを作成します。デフォルトでは、Pool クラスは CPU コアごとに 1 つのプロセスを作成します。次に、いくつかのパラメーターを指定して map メソッドを実行します。

map

メソッドは、提供する反復可能オブジェクトの各要素に cube 関数を適用します。この場合、10# からの各数値のリストです。 ## から N まで。 これを行う最大の利点は、リストの計算が並行して実行されることです。

joblib

Package

joblib

は、並列コンピューティングを容易にするツールのセットです。マルチプロセス用の汎用サードパーティライブラリです。また、キャッシュ機能とシリアル化機能も提供します。

joblib パッケージをインストールするには、ターミナルで次のコマンドを使用します:

pip install joblib

ログイン後にコピー

前の例を、joblib を使用する次の例に変換できます:

from joblib import Parallel, delayed
 
def cube(x):
    return x**3
 
start_time = time.perf_counter()
result = Parallel(n_jobs=3)(delayed(cube)(i) for i in range(1,1000))
finish_time = time.perf_counter()
print(f"Program finished in {finish_time-start_time} seconds")
print(result)

ログイン後にコピー

実際、それが何をするのか直感的に見てください。 layed()関数は、関数呼び出しの「遅延」バージョンを生成する別の関数のラッパーです。これは、関数が呼び出されてもすぐには実行されないことを意味します。

然后，我们多次调用delayed函数，并传递不同的参数集。例如，当我们将整数1赋予cube函数的延迟版本时，我们不计算结果，而是分别为函数对象、位置参数和关键字参数生成元组(cube, (1,), {})。

我们使用Parallel()创建了引擎实例。当它像一个以元组列表作为参数的函数一样被调用时，它将实际并行执行每个元组指定的作业，并在所有作业完成后收集结果作为列表。在这里，我们创建了n_jobs=3的Parallel()实例，因此将有三个进程并行运行。

我们也可以直接编写元组。因此，上面的代码可以重写为：

result = Parallel(n_jobs=3)((cube, (i,), {}) for i in range(1,1000))

ログイン後にコピー

使用joblib的好处是，我们可以通过简单地添加一个附加参数在多线程中运行代码：

result = Parallel(n_jobs=3, prefer="threads")(delayed(cube)(i) for i in range(1,1000))

ログイン後にコピー

这隐藏了并行运行函数的所有细节。我们只是使用与普通列表理解没有太大区别的语法。

充分利用 Python多进程

创建多个进程并进行并行计算不一定比串行计算更有效。对于 CPU 密集度较低的任务，串行计算比并行计算快。因此，了解何时应该使用多进程非常重要——这取决于你正在执行的任务。

为了让你相信这一点，让我们看一个简单的例子：

from multiprocessing import Pool
import time
import math

N = 5000000

def cube(x):
    return math.sqrt(x)

if __name__ == "__main__":
    # first way, using multiprocessing
    start_time = time.perf_counter()
    with Pool() as pool:
      result = pool.map(cube, range(10,N))
    finish_time = time.perf_counter()
    print("Program finished in {} seconds - using multiprocessing".format(finish_time-start_time))
    print("---")
    # second way, serial computation
    start_time = time.perf_counter()
    result = []
    for x in range(10,N):
      result.append(cube(x))
    finish_time = time.perf_counter()
    print("Program finished in {} seconds".format(finish_time-start_time))

ログイン後にコピー

此代码段基于前面的示例。我们正在解决同样的问题，即计算N个数的平方根，但有两种方法。第一个涉及 Python 进程的使用，而第二个不涉及。我们使用time库中的perf_counter()方法来测量时间性能。

在我的电脑上，我得到了这个结果：

> python code.py
Program finished in 1.6385094 seconds - using multiprocessing
---
Program finished in 2.7373942999999996 seconds

ログイン後にコピー

如你所见，相差不止一秒。所以在这种情况下，多进程更好。

让我们更改代码中的某些内容，例如N的值。让我们把它降低到N=10000，看看会发生什么。

这就是我现在得到的：

> python code.py
Program finished in 0.3756742 seconds - using multiprocessing
---
Program finished in 0.005098400000000003 seconds

ログイン後にコピー

发生了什么？现在看来，多进程是一个糟糕的选择。为什么？

与解决的任务相比，在进程之间拆分计算所带来的开销太大了。你可以看到在时间性能方面有多大差异。

以上がPythonマルチプロセスの適用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7464

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

PSフェザーリングは、遷移の柔らかさをどのように制御しますか？ Apr 06, 2025 pm 07:33 PM

羽毛の鍵は、その漸進的な性質を理解することです。 PS自体は、勾配曲線を直接制御するオプションを提供しませんが、複数の羽毛、マッチングマスク、および細かい選択により、半径と勾配の柔らかさを柔軟に調整して、自然な遷移効果を実現できます。

mysqlは支払う必要がありますか Apr 08, 2025 pm 05:36 PM

MySQLには、無料のコミュニティバージョンと有料エンタープライズバージョンがあります。コミュニティバージョンは無料で使用および変更できますが、サポートは制限されており、安定性要件が低く、技術的な能力が強いアプリケーションに適しています。 Enterprise Editionは、安定した信頼性の高い高性能データベースを必要とするアプリケーションに対する包括的な商業サポートを提供し、サポートの支払いを喜んでいます。バージョンを選択する際に考慮される要因には、アプリケーションの重要性、予算編成、技術スキルが含まれます。完璧なオプションはなく、最も適切なオプションのみであり、特定の状況に応じて慎重に選択する必要があります。

PSフェザーリングをセットアップする方法は？ Apr 06, 2025 pm 07:36 PM

PSフェザーリングは、イメージエッジブラー効果であり、エッジエリアのピクセルの加重平均によって達成されます。羽の半径を設定すると、ぼやけの程度を制御でき、値が大きいほどぼやけます。半径の柔軟な調整は、画像とニーズに応じて効果を最適化できます。たとえば、キャラクターの写真を処理する際に詳細を維持するためにより小さな半径を使用し、より大きな半径を使用してアートを処理するときにかすんだ感覚を作成します。ただし、半径が大きすぎるとエッジの詳細を簡単に失う可能性があり、効果が小さすぎると明らかになりません。羽毛効果は画像解像度の影響を受け、画像の理解と効果の把握に従って調整する必要があります。

MySQLインストール後にデータベースのパフォーマンスを最適化する方法 Apr 08, 2025 am 11:36 AM

MySQLパフォーマンスの最適化は、インストール構成、インデックス作成、クエリの最適化、監視、チューニングの3つの側面から開始する必要があります。 1。インストール後、INNODB_BUFFER_POOL_SIZEパラメーターやclose query_cache_sizeなど、サーバーの構成に従ってmy.cnfファイルを調整する必要があります。 2。過度のインデックスを回避するための適切なインデックスを作成し、説明コマンドを使用して実行計画を分析するなど、クエリステートメントを最適化します。 3. MySQL独自の監視ツール（ShowProcessList、ShowStatus）を使用して、データベースの健康を監視し、定期的にデータベースをバックアップして整理します。これらの手順を継続的に最適化することによってのみ、MySQLデータベースのパフォーマンスを改善できます。

PS Featheringは画質にどのような影響を与えますか？ Apr 06, 2025 pm 07:21 PM

PSフェザーリングは、画像の詳細の喪失、色の飽和の減少、およびノイズの増加につながる可能性があります。影響を減らすために、小さな羽の半径を使用し、レイヤーをコピーしてから羽毛をコピーし、羽毛の前後に画質を慎重に比較することをお勧めします。さらに、フェザーリングはすべてのケースに適しておらず、マスクなどのツールが画像エッジの処理に適している場合があります。

高負荷アプリケーションのMySQLパフォーマンスを最適化する方法は？ Apr 08, 2025 pm 06:03 PM

MySQLデータベースパフォーマンス最適化ガイドリソース集約型アプリケーションでは、MySQLデータベースが重要な役割を果たし、大規模なトランザクションの管理を担当しています。ただし、アプリケーションのスケールが拡大すると、データベースパフォーマンスのボトルネックが制約になることがよくあります。この記事では、一連の効果的なMySQLパフォーマンス最適化戦略を検討して、アプリケーションが高負荷の下で効率的で応答性の高いままであることを保証します。実際のケースを組み合わせて、インデックス作成、クエリ最適化、データベース設計、キャッシュなどの詳細な主要なテクノロジーを説明します。 1.データベースアーキテクチャの設計と最適化されたデータベースアーキテクチャは、MySQLパフォーマンスの最適化の基礎です。いくつかのコア原則は次のとおりです。適切なデータ型を選択し、ニーズを満たす最小のデータ型を選択すると、ストレージスペースを節約するだけでなく、データ処理速度を向上させることもできます。

MongoDBデータベースパスワードを表示するNAVICATの方法 Apr 08, 2025 pm 09:39 PM

Hash値として保存されているため、Navicatを介してMongoDBパスワードを直接表示することは不可能です。紛失したパスワードを取得する方法：1。パスワードのリセット。 2。構成ファイルを確認します（ハッシュ値が含まれる場合があります）。 3.コードを確認します（パスワードをハードコードできます）。

See all articles

Pythonマルチプロセスの適用方法

並列およびシリアル コンピューティング

並列プログラミング モデル

Python マルチプロセスの開始

CPU 集中型のタスクを処理するために複数のプロセスを作成する必要がある場合はどうすればよいでしょうか?常に明示的に開始して終了を待つ必要があるのでしょうか?ここでの解決策は、

joblib

充分利用 Python多进程

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

並列およびシリアルコンピューティング

並列プログラミングモデル