Le remplacement d'un compteur de boucle 32 bits par 64 bits peut entraîner des écarts de performances importants avec _mm_popcnt_u64 sur les processeurs Intel
Ce problème survient en raison à une fausse dépendance de données, plus précisément, l'instruction
_mm_popcnt_u64 a un faux dépendance à l'égard de son registre de destination, l'obligeant à attendre que le registre de destination soit prêt avant de s'exécuter. Cette dépendance peut se répercuter sur les itérations de boucle, ce qui rend difficile pour le processeur de paralléliser différentes itérations de boucle.
Le choix du type de variable de boucle (non signée ou uint64_t) influence l'allocateur de registre
qui attribue des registres à des variables, entraînant des différences dans l'allocation des registres et de fausses chaînes de dépendance pour les Instructions _mm_popcnt_u64.
L'insertion du mot-clé static devant la variable de taille
peut modifier l'allocation des registres et briser les fausses chaînes de dépendances. Dans certains cas, cela peut conduire à une amélioration des performances en éliminant la dépendance entre itérations sur le registre de destination.
Pour atténuer ce problème et obtenir des performances cohérentes :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!