Maison > développement back-end > Tutoriel Python > Comment les arguments \'levels\', \'keys\' et \'names\' dans la fonction `concat` de Pandas aident-ils à créer et à personnaliser les structures MultiIndex dans les DataFrames ?

Comment les arguments \'levels\', \'keys\' et \'names\' dans la fonction `concat` de Pandas aident-ils à créer et à personnaliser les structures MultiIndex dans les DataFrames ?

DDD
Libérer: 2024-10-27 04:12:30
original
349 Les gens l'ont consulté

How do the 'levels', 'keys', and 'names' arguments in Pandas' `concat` function help create and customize MultiIndex structures in DataFrames?

À quoi servent les arguments « niveaux », « clés » et noms dans la fonction concat de Pandas ?

Introduction

Le pandas.concat () est un outil polyvalent permettant de combiner plusieurs objets Series ou DataFrame en un seul DataFrame consolidé. Il propose plusieurs arguments pour personnaliser le processus de concaténation, notamment les arguments de niveaux, de clés et de noms. Ce guide fournit une explication complète de ces arguments, avec des exemples pour démontrer leur utilisation.

Utilisation de la fonction concat()

La syntaxe de la fonction pandas.concat() est la suivante :

<code class="python">pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)</code>
Copier après la connexion

L'extrait de code suivant montre un exemple simple de concaténation de deux DataFrames le long de l'axe d'index :

<code class="python">import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

df = pd.concat([df1, df2])

print(df)</code>
Copier après la connexion

Sortie :

   A  B
0  1  4
1  2  5
2  3  6
3  7  10
4  8  11
5  9  12
Copier après la connexion

Les clés Argument

L'argument clés vous permet de spécifier une liste de valeurs scalaires ou de tuples pour créer une structure MultiIndex dans le DataFrame résultant. Chaque élément de la liste des clés correspond à l'un des objets concaténés.

Par exemple, considérons l'extrait de code suivant :

<code class="python">keys = ['df1', 'df2']
df = pd.concat([df1, df2], keys=keys)

print(df)</code>
Copier après la connexion

Sortie :

    A  B
df1 0  1  4
    1  2  5
    2  3  6
df2 3  7  10
    4  8  11
    5  9  12
Copier après la connexion

L'argument clés crée un nouveau niveau dans l'index, nommé « clés ». Cela vous permet d'identifier facilement quelles lignes appartiennent à quel DataFrame.

L'argument des niveaux

L'argument des niveaux est utilisé pour spécifier les niveaux spécifiques du MultiIndex à utiliser. Il attend une liste de séquences, chaque séquence représentant un niveau dans le MultiIndex.

Par exemple, le code suivant spécifie que le MultiIndex doit avoir deux niveaux :

<code class="python">levels = [['df1', 'df2'], ['A', 'B']]
df = pd.concat([df1, df2], keys=keys, levels=levels)

print(df)</code>
Copier après la connexion

Sortie :

    A  B
df1 A 0  1  4
   B 1  2  5
   C 2  3  6
df2 A 3  7  10
   B 4  8  11
   C 5  9  12
Copier après la connexion

L'argument niveaux offre une flexibilité dans la création de structures MultiIndex plus complexes.

L'argument noms

L'argument noms vous permet de spécifier des noms personnalisés pour les niveaux du MultiIndex. Il attend une liste de chaînes, chaque chaîne représentant le nom d'un niveau.

<code class="python">names = ['DataFrame', 'Column']
df = pd.concat([df1, df2], keys=keys, levels=levels, names=names)

print(df)</code>
Copier après la connexion

Sortie :

DataFrame Column  A  B
df1        A   0  1  4
            B   1  2  5
            C   2  3  6
df2        A   3  7  10
           B   4  8  11
           C   5  9  12
Copier après la connexion

L'argument noms aide à fournir du contexte et à améliorer la lisibilité lorsqu'il s'agit de structures MultiIndex. .

Conclusion

Les arguments niveaux, clés et noms sont des outils puissants pour personnaliser le processus de concaténation dans les pandas. Ils vous permettent de créer des structures MultiIndex flexibles et informatives qui facilitent l’analyse et la manipulation des données. En comprenant l'utilisation de ces arguments, vous pouvez améliorer vos compétences en programmation pandas et gérer efficacement vos données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal