Concaténation de chaînes en Python : atteindre l'efficacité
En Python, l'ajout d'une chaîne à une autre se fait traditionnellement par affectation :
var1 = "foo" var2 = "bar" var3 = var1 + var2
Bien que cette approche soit simple, elle peut devenir inefficace lors de la concaténation de plusieurs chaînes, notamment dans une boucle. Pour résoudre ce problème, CPython a introduit une optimisation pour améliorer les performances dans de tels scénarios.
Optimisation de la concaténation de chaînes de CPython
L'optimisation de CPython implique une extension sur place de la chaîne. Lorsqu'une chaîne est concaténée à la fin d'une autre chaîne référencée par une seule variable, l'interpréteur tente d'étendre la chaîne d'origine au lieu de créer un nouvel objet. Cette opération est amortie en O(n), ce qui signifie que la complexité temporelle pour ajouter plusieurs chaînes dans une boucle est considérablement réduite.
Par exemple, le code suivant :
s = "" for i in range(n): s += str(i)
qui utilisait pour avoir une complexité temporelle de O(n^2), s'exécute désormais à O(n).
Impact de l'optimisation
Cette optimisation a un impact substantiel sur les performances, surtout pour la concaténation de chaînes dans les boucles. Des tests empiriques démontrent que l'ajout d'un million de chaînes ne prend désormais que 173 millisecondes, contre 14,6 secondes avec l'ancienne approche O(n^2).
Limitations
C'est important à noter que cette optimisation est spécifique à CPython et peut ne pas s'appliquer à d'autres implémentations Python comme PyPy ou Jython. De plus, cela ne s'applique que lorsqu'une chaîne est référencée par une seule variable. S'il existe plusieurs références, l'objet chaîne d'origine ne sera pas étendu et les avantages en termes de performances seront perdus.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!