Maison développement back-end C++ Comment effectuer du calcul parallèle de code C++ ?

Comment effectuer du calcul parallèle de code C++ ?

Nov 03, 2023 am 10:15 AM
c++ 代码 并行计算

Comment effectuer du calcul parallèle de code C++ ?

Avec l'amélioration continue des performances du matériel informatique, le calcul parallèle pour les processeurs multicœurs est devenu un sujet important dans le domaine de la programmation. En tant que langage de programmation efficace, le C++ dispose naturellement de diverses méthodes pour implémenter le calcul parallèle. Cet article présentera plusieurs méthodes de calcul parallèle C++ couramment utilisées et montrera respectivement leur implémentation de code et leurs scénarios d'utilisation.

  1. OpenMP

OpenMP est une API de calcul parallèle basée sur la mémoire partagée qui peut facilement ajouter du code de parallélisation aux programmes C++. Il utilise la directive #pragma pour identifier les segments de code qui doivent être parallélisés et fournit une série de fonctions de bibliothèque pour implémenter le calcul parallèle. Voici un exemple de programme OpenMP simple :

#include <iostream>
#include <omp.h>

using namespace std;

int main() {
    int data[1000], i, sum = 0;
    for (i=0;i<1000;i++){
        data[i] = i+1;
    }

    #pragma omp parallel for reduction(+:sum)
    for (i=0;i<1000;i++){
        sum += data[i];
    }
    cout << "Sum: " << sum << endl;
    return 0;
}
Copier après la connexion

Dans cet exemple, la directive #pragma omp est utilisée pour paralléliser la boucle for. En même temps, utilisez l'instruction réduction(+:sum) pour indiquer à OpenMP d'ajouter la variable sum. Lorsque ce programme est exécuté sur un ordinateur utilisant 4 cœurs, vous pouvez constater que le temps d'exécution est 3 à 4 fois plus rapide que la version monothread.

  1. MPI

MPI est une interface de transmission de messages qui permet le calcul parallèle distribué entre plusieurs ordinateurs. L'unité de base d'un programme MPI est un processus, et chaque processus est exécuté dans un espace mémoire indépendant. Les programmes MPI peuvent s'exécuter sur un seul ordinateur ou sur plusieurs ordinateurs. Ce qui suit est un exemple de programme MPI de base :

#include <iostream>
#include <mpi.h>

using namespace std;

int main(int argc, char** argv) {
    int rank, size;
    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    cout << "Hello world from rank " << rank << " of " << size << endl;

    MPI_Finalize();
    return 0;
}
Copier après la connexion

Dans cet exemple, l'environnement MPI est initialisé via la fonction MPI_Init(), et les fonctions MPI_Comm_rank() et MPI_Comm_size() sont utilisées pour obtenir le numéro de processus d'un seul processus et le nombre total de processus. Ici, je produis simplement une phrase. En exécutant la commande mpirun -np 4, ce programme peut être exécuté sur 4 processus.

  1. TBB

Intel Threading Building Blocks (TBB) est une bibliothèque C++ qui fournit des outils pour simplifier le calcul parallèle. Le concept principal de TBB est celui des tâches, qui parallélisent certains travaux grâce à la collaboration entre les nœuds et les tâches. Voici un exemple de programme TBB :

#include <iostream>
#include <tbb/tbb.h>

using namespace std;

class Sum {
public:
    Sum() : sum(0) {}
    Sum(Sum& s, tbb::split) : sum(0) {}
    void operator()(const tbb::blocked_range<int>& r) {
        for (int i=r.begin();i!=r.end();i++){
            sum += i;
        }
    }
    void join(Sum&s) {
        sum += s.sum;
    }
    int getSum() const {
        return sum;
    }

private:
    int sum;
};

int main() {
    Sum s;
    tbb::parallel_reduce(tbb::blocked_range<int>(0, 1000), s);
    cout << "Sum: " << s.getSum() << endl;
    return 0;
}
Copier après la connexion

Dans cet exemple, une classe Sum est définie pour implémenter le calcul parallèle, tbb::blocked_range changement de fonction. Lorsque ce programme est exécuté sur un ordinateur utilisant 4 cœurs, vous pouvez constater que le temps d'exécution est 3 à 4 fois plus rapide que la version monothread.

Ces trois méthodes ont chacune leurs propres avantages et inconvénients. La méthode à choisir dépend principalement du scénario d'application spécifique. OpenMP peut être utilisé sur une seule machine avec mémoire partagée et peut facilement ajouter du code de parallélisation aux programmes C++ existants pour accélérer l'exécution du programme. MPI convient à une utilisation sur des clusters informatiques distribués et peut réaliser la parallélisation en transmettant des messages entre plusieurs ordinateurs. TBB est une bibliothèque C++ multiplateforme qui fournit des outils efficaces pour simplifier le calcul parallèle.

En résumé, pour les applications nécessitant un calcul parallèle, C++ offre une variété d'options pour obtenir une parallélisation efficace. Les développeurs peuvent choisir une ou plusieurs méthodes pour accomplir leurs tâches en fonction de leurs propres besoins et scénarios d'application, et améliorer les performances du programme à un nouveau niveau.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Quel est le rôle de char dans les chaînes C Quel est le rôle de char dans les chaînes C Apr 03, 2025 pm 03:15 PM

En C, le type de char est utilisé dans les chaînes: 1. Stockez un seul caractère; 2. Utilisez un tableau pour représenter une chaîne et se terminer avec un terminateur nul; 3. Faire fonctionner via une fonction de fonctionnement de chaîne; 4. Lisez ou sortant une chaîne du clavier.

Comment calculer C-SUBScript 3 Indice 5 C-SUBScript 3 Indice Indice 5 Tutoriel d'algorithme Comment calculer C-SUBScript 3 Indice 5 C-SUBScript 3 Indice Indice 5 Tutoriel d'algorithme Apr 03, 2025 pm 10:33 PM

Le calcul de C35 est essentiellement des mathématiques combinatoires, représentant le nombre de combinaisons sélectionnées parmi 3 des 5 éléments. La formule de calcul est C53 = 5! / (3! * 2!), Qui peut être directement calculé par des boucles pour améliorer l'efficacité et éviter le débordement. De plus, la compréhension de la nature des combinaisons et la maîtrise des méthodes de calcul efficaces est cruciale pour résoudre de nombreux problèmes dans les domaines des statistiques de probabilité, de la cryptographie, de la conception d'algorithmes, etc.

Quatre façons d'implémenter le multithreading dans le langage C Quatre façons d'implémenter le multithreading dans le langage C Apr 03, 2025 pm 03:00 PM

Le multithreading dans la langue peut considérablement améliorer l'efficacité du programme. Il existe quatre façons principales d'implémenter le multithreading dans le langage C: créer des processus indépendants: créer plusieurs processus en cours d'exécution indépendante, chaque processus a son propre espace mémoire. Pseudo-Multithreading: Créez plusieurs flux d'exécution dans un processus qui partagent le même espace mémoire et exécutent alternativement. Bibliothèque multi-thread: Utilisez des bibliothèques multi-threades telles que PTHEADS pour créer et gérer des threads, en fournissant des fonctions de fonctionnement de thread riches. Coroutine: une implémentation multi-thread légère qui divise les tâches en petites sous-tâches et les exécute tour à tour.

Fonction de fonction distincte Distance de distance C Tutoriel d'utilisation Fonction de fonction distincte Distance de distance C Tutoriel d'utilisation Apr 03, 2025 pm 10:27 PM

STD :: Unique supprime les éléments en double adjacents dans le conteneur et les déplace jusqu'à la fin, renvoyant un itérateur pointant vers le premier élément en double. STD :: Distance calcule la distance entre deux itérateurs, c'est-à-dire le nombre d'éléments auxquels ils pointent. Ces deux fonctions sont utiles pour optimiser le code et améliorer l'efficacité, mais il y a aussi quelques pièges à prêter attention, tels que: std :: unique traite uniquement des éléments en double adjacents. STD :: La distance est moins efficace lorsqu'il s'agit de transacteurs d'accès non aléatoires. En maîtrisant ces fonctionnalités et les meilleures pratiques, vous pouvez utiliser pleinement la puissance de ces deux fonctions.

Comment appliquer la nomenclature des serpents dans le langage C? Comment appliquer la nomenclature des serpents dans le langage C? Apr 03, 2025 pm 01:03 PM

Dans le langage C, Snake Nomenclature est une convention de style de codage, qui utilise des soulignements pour connecter plusieurs mots pour former des noms de variables ou des noms de fonction pour améliorer la lisibilité. Bien que cela n'affecte pas la compilation et l'exploitation, la dénomination longue, les problèmes de support IDE et les bagages historiques doivent être pris en compte.

Utilisation de la libération de la release en C Utilisation de la libération de la release en C Apr 04, 2025 am 07:54 AM

La fonction release_semaphore en C est utilisée pour libérer le sémaphore obtenu afin que d'autres threads ou processus puissent accéder aux ressources partagées. Il augmente le nombre de sémaphore de 1, permettant au fil de blocage de continuer l'exécution.

Problèmes avec la version Dev-C Problèmes avec la version Dev-C Apr 03, 2025 pm 07:33 PM

Dev-C 4.9.9.2 Erreurs et solutions de compilation Lors de la compilation de programmes dans le système Windows 11 à l'aide de Dev-C 4.9.9.2, le volet d'enregistrement du compilateur peut afficher le message d'erreur suivant: GCCC.EXE: InternalError: Aborti (ProgramCollect2) Pleasesubmitafullbugreport.seeforinsstructions. Bien que la "compilation finale soit réussie", le programme réel ne peut pas s'exécuter et un message d'erreur "Archive de code d'origine ne peut pas être compilé" apparaît. C'est généralement parce que le linker recueille

CHARRAMMAGE C ET CHARRAMMAGE C ET Apr 06, 2025 am 12:06 AM

C convient à la programmation système et à l'interaction matérielle car elle fournit des capacités de contrôle proches du matériel et des fonctionnalités puissantes de la programmation orientée objet. 1) C Grâce à des fonctionnalités de bas niveau telles que le pointeur, la gestion de la mémoire et le fonctionnement des bits, un fonctionnement efficace au niveau du système peut être réalisé. 2) L'interaction matérielle est implémentée via des pilotes de périphérique, et C peut écrire ces pilotes pour gérer la communication avec des périphériques matériels.

See all articles