


Pourquoi « std :: atomic » utilise-t-il « XCHG » pour les magasins séquentiellement cohérents ?
Pourquoi std::atomic utilise XCHG pour les magasins de cohérence séquentielle
Contexte
Dans le domaine du multithreading, la classe std::atomic fournit un des moyens pour un accès simultané aux données partagées entre les threads tout en garantissant l'intégrité des données. Sa fonction membre de magasin permet d'écrire des valeurs dans une variable atomique avec une sémantique d'ordre de mémoire spécifiée.
Dans le cas d'une cohérence séquentielle (std::memory_order_seq_cst), les architectures x86 utilisent une instruction xchg pour implémenter des magasins atomiques. Cette instruction effectue un échange simultané de valeurs plutôt qu'une simple opération de stockage.
Motivation pour XCHG
Bien qu'il puisse sembler qu'une instruction de stockage simple couplée à une barrière de mémoire (par exemple, _ReadWriteBarrier() ou asm volatile("" ::: "memory");) suffirait pour la cohérence séquentielle, l'utilisation de xchg a plusieurs avantages :
1. Barrière de mémoire complète : xchg agit comme une barrière de mémoire complète sur x86 en raison de son préfixe de verrouillage implicite. Cela garantit que toutes les opérations de mémoire avant et après xchg sont ordonnées, empêchant ainsi la réorganisation de la mémoire.
2. La sémantique de version est insuffisante : Une opération de magasin normale sur x86 présente une sémantique de version, qui permet une réorganisation avec les opérations ultérieures, y compris l'acquisition de charges. La cohérence séquentielle, en revanche, exige qu'une telle réorganisation soit interdite.
Considérations sur les performances
Le choix entre xchg et mov mfence pour les magasins atomiques a des implications sur les performances :
- Skylake : mfence bloque l'exécution dans le désordre des instructions ALU, alors que xchg le fait pas. Cependant, xchg comporte une fausse dépendance sur la valeur précédemment chargée.
- AMD : Le manuel d'optimisation matérielle recommande d'utiliser xchg pour les magasins de cohérence séquentielle.
- GCC/ Optimisation Clang : Les compilateurs modernes préfèrent généralement xchg à mov mfence.
Alternative pour les clôtures de threads
Outre l'utilisation de xchg pour les magasins atomiques, d'autres options pour implémenter des clôtures de threads atomiques (également avec l'ordre de mémoire seq_cst) incluent :
- lock ajouter à la pile
- lock ou dword [rsp], 0
Distinguer libération et acquisition
Il est important de noter que :
- Un magasin avec une cohérence séquentielle n'implique pas l'acquisition de sémantique.
- asm volatile("" ::: "memory"); est une barrière du compilateur uniquement et n'impose pas la cohérence séquentielle.
- L'émulation de la cohérence séquentielle avec des opérations d'ordre plus faibles et des clôtures peut ne pas s'aligner entièrement sur le modèle de machine abstraite C.
Conclusion
En résumé, les magasins std::atomic avec cohérence séquentielle sur les architectures x86 utilisent xchg en raison de son effet de barrière mémoire complète et de sa compatibilité avec les exigences. de cohérence séquentielle. Bien que des implémentations alternatives existent, xchg reste une solution largement adoptée pour son efficacité et sa conformité aux recommandations de l'industrie.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











L'histoire et l'évolution de C # et C sont uniques, et les perspectives d'avenir sont également différentes. 1.C a été inventé par Bjarnestrousstrup en 1983 pour introduire une programmation orientée objet dans le langage C. Son processus d'évolution comprend plusieurs normalisations, telles que C 11, introduisant des mots clés automobiles et des expressions de lambda, C 20 introduisant les concepts et les coroutines, et se concentrera sur les performances et la programmation au niveau du système à l'avenir. 2.C # a été publié par Microsoft en 2000. Combinant les avantages de C et Java, son évolution se concentre sur la simplicité et la productivité. Par exemple, C # 2.0 a introduit les génériques et C # 5.0 a introduit la programmation asynchrone, qui se concentrera sur la productivité et le cloud computing des développeurs à l'avenir.

Il existe des différences significatives dans les courbes d'apprentissage de l'expérience C # et C et du développeur. 1) La courbe d'apprentissage de C # est relativement plate et convient au développement rapide et aux applications au niveau de l'entreprise. 2) La courbe d'apprentissage de C est raide et convient aux scénarios de contrôle haute performance et de bas niveau.

L'application de l'analyse statique en C comprend principalement la découverte de problèmes de gestion de la mémoire, la vérification des erreurs de logique de code et l'amélioration de la sécurité du code. 1) L'analyse statique peut identifier des problèmes tels que les fuites de mémoire, les doubles versions et les pointeurs non initialisés. 2) Il peut détecter les variables inutilisées, le code mort et les contradictions logiques. 3) Les outils d'analyse statique tels que la couverture peuvent détecter le débordement de tampon, le débordement entier et les appels API dangereux pour améliorer la sécurité du code.

C interagit avec XML via des bibliothèques tierces (telles que TinyXML, PUGIXML, XERCES-C). 1) Utilisez la bibliothèque pour analyser les fichiers XML et les convertir en structures de données propices à C. 2) Lors de la génération de XML, convertissez la structure des données C au format XML. 3) Dans les applications pratiques, le XML est souvent utilisé pour les fichiers de configuration et l'échange de données afin d'améliorer l'efficacité du développement.

L'utilisation de la bibliothèque Chrono en C peut vous permettre de contrôler plus précisément les intervalles de temps et de temps. Explorons le charme de cette bibliothèque. La bibliothèque Chrono de C fait partie de la bibliothèque standard, qui fournit une façon moderne de gérer les intervalles de temps et de temps. Pour les programmeurs qui ont souffert de temps et ctime, Chrono est sans aucun doute une aubaine. Il améliore non seulement la lisibilité et la maintenabilité du code, mais offre également une précision et une flexibilité plus élevées. Commençons par les bases. La bibliothèque Chrono comprend principalement les composants clés suivants: std :: chrono :: system_clock: représente l'horloge système, utilisée pour obtenir l'heure actuelle. std :: chron

L'avenir de C se concentrera sur l'informatique parallèle, la sécurité, la modularisation et l'apprentissage AI / Machine: 1) L'informatique parallèle sera améliorée par des fonctionnalités telles que les coroutines; 2) La sécurité sera améliorée par le biais de mécanismes de vérification et de gestion de la mémoire plus stricts; 3) La modulation simplifiera l'organisation et la compilation du code; 4) L'IA et l'apprentissage automatique inviteront C à s'adapter à de nouveaux besoins, tels que l'informatique numérique et le support de programmation GPU.

C isnotdying; il se révolte.1) C reste réévèreurtoitSversatity et effecciation en termes

C # utilise le mécanisme de collecte automatique des ordures, tandis que C utilise la gestion manuelle de la mémoire. 1. Le collecteur des ordures de C # gère automatiquement la mémoire pour réduire le risque de fuite de mémoire, mais peut entraîner une dégradation des performances. 2.C fournit un contrôle de mémoire flexible, adapté aux applications qui nécessitent une gestion des beaux, mais doivent être manipulées avec prudence pour éviter les fuites de mémoire.
