Le pandas.concat () est un outil polyvalent permettant de combiner plusieurs objets Series ou DataFrame en un seul DataFrame consolidé. Il propose plusieurs arguments pour personnaliser le processus de concaténation, notamment les arguments de niveaux, de clés et de noms. Ce guide fournit une explication complète de ces arguments, avec des exemples pour démontrer leur utilisation.
La syntaxe de la fonction pandas.concat() est la suivante :
<code class="python">pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)</code>
L'extrait de code suivant montre un exemple simple de concaténation de deux DataFrames le long de l'axe d'index :
<code class="python">import pandas as pd df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]}) df = pd.concat([df1, df2]) print(df)</code>
Sortie :
A B 0 1 4 1 2 5 2 3 6 3 7 10 4 8 11 5 9 12
L'argument clés vous permet de spécifier une liste de valeurs scalaires ou de tuples pour créer une structure MultiIndex dans le DataFrame résultant. Chaque élément de la liste des clés correspond à l'un des objets concaténés.
Par exemple, considérons l'extrait de code suivant :
<code class="python">keys = ['df1', 'df2'] df = pd.concat([df1, df2], keys=keys) print(df)</code>
Sortie :
A B df1 0 1 4 1 2 5 2 3 6 df2 3 7 10 4 8 11 5 9 12
L'argument clés crée un nouveau niveau dans l'index, nommé « clés ». Cela vous permet d'identifier facilement quelles lignes appartiennent à quel DataFrame.
L'argument des niveaux est utilisé pour spécifier les niveaux spécifiques du MultiIndex à utiliser. Il attend une liste de séquences, chaque séquence représentant un niveau dans le MultiIndex.
Par exemple, le code suivant spécifie que le MultiIndex doit avoir deux niveaux :
<code class="python">levels = [['df1', 'df2'], ['A', 'B']] df = pd.concat([df1, df2], keys=keys, levels=levels) print(df)</code>
Sortie :
A B df1 A 0 1 4 B 1 2 5 C 2 3 6 df2 A 3 7 10 B 4 8 11 C 5 9 12
L'argument niveaux offre une flexibilité dans la création de structures MultiIndex plus complexes.
L'argument noms vous permet de spécifier des noms personnalisés pour les niveaux du MultiIndex. Il attend une liste de chaînes, chaque chaîne représentant le nom d'un niveau.
<code class="python">names = ['DataFrame', 'Column'] df = pd.concat([df1, df2], keys=keys, levels=levels, names=names) print(df)</code>
Sortie :
DataFrame Column A B df1 A 0 1 4 B 1 2 5 C 2 3 6 df2 A 3 7 10 B 4 8 11 C 5 9 12
L'argument noms aide à fournir du contexte et à améliorer la lisibilité lorsqu'il s'agit de structures MultiIndex. .
Les arguments niveaux, clés et noms sont des outils puissants pour personnaliser le processus de concaténation dans les pandas. Ils vous permettent de créer des structures MultiIndex flexibles et informatives qui facilitent l’analyse et la manipulation des données. En comprenant l'utilisation de ces arguments, vous pouvez améliorer vos compétences en programmation pandas et gérer efficacement vos données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!