Python est un langage de programmation polyvalent de haut niveau qui est devenu de plus en plus populaire ces dernières années, en partie en raison de sa capacité à gérer facilement de grandes quantités de données. La bibliothèque pandas est l'un des outils les plus puissants pour travailler avec des données dans l'écosystème Python, fournissant des structures de données faciles à utiliser telles que DataFrame et Series.
Dans ce tutoriel, nous nous concentrerons sur une tâche courante en analyse de données : convertir une liste en lignes DataFrame en Python à l'aide de pandas. Il s'agit d'une compétence essentielle pour toute personne travaillant avec des données en Python, car elle vous permet d'ajouter rapidement et facilement de nouvelles lignes de données à un DataFrame. Dans le reste de cet article, nous vous guiderons pas à pas à travers le processus de conversion d'une liste en lignes DataFrame.
Pour convertir la liste en lignes DataFrame, nous utiliserons la bibliothèque Pandas. Assurez-vous d’abord que pandas est installé sur notre système.
Pour installer pandas, vous pouvez utiliser le gestionnaire de packages Python appelé pip, accessible via l'invite de commande ou le terminal. Pour ce faire, entrez simplement la commande fournie ci-dessous.
pip install pandas
La commande ci-dessus téléchargera et installera la dernière version de Pandas sur votre système. Une fois installé, nous pouvons l'utiliser pour convertir la liste en lignes DataFrame.
Pour convertir une liste en lignes DataFrame, nous devons d'abord créer une liste contenant les données que nous souhaitons ajouter. Cette liste doit contenir le même nombre d'éléments que le nombre de colonnes du DataFrame. Supposons que nous ayons un DataFrame avec trois colonnes : « Nom », « Âge » et « Ville ».
Considérez l'extrait de code suivant pour créer une liste de données de nouvelles lignes :
new_row_data = ['Prince', 26, 'New Delhi]
La prochaine étape clé de notre processus consiste à générer un tout nouvel objet DataFrame qui copie les noms de colonnes du DataFrame existant. Il est crucial de s'assurer que les noms de colonnes correspondent pour ajouter efficacement de nouvelles lignes à un DataFrame à l'aide de pandas.
Pour y parvenir, nous pouvons créer un DataFrame vide avec exactement les mêmes noms de colonnes que le DataFrame d'origine.
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
Maintenant que nous avons créé un nouveau DataFrame vide avec les noms de colonnes appropriés, il est temps d'y ajouter des données. Nous pouvons y parvenir en utilisant la méthode "append" de l'objet DataFrame, qui nous permet d'ajouter de nouvelles lignes de données à un DataFrame existant. Pour ce faire, nous devons transmettre l'objet pandas Series à la méthode "append" représentant la nouvelle ligne de données.
Pour éviter d'écraser les lignes existantes dans le DataFrame, nous devons transmettre le paramètre "ignore_index=True" lors de l'ajout de nouvelles lignes. Cela garantit que les nouvelles lignes sont ajoutées en tant que lignes entièrement nouvelles avec des numéros d'index uniques.
Considérez le code ci-dessous, qui ajoute de nouvelles lignes à notre dataframe à l'aide de la méthode append.
import pandas as pd # create a list of data for the new row new_row_data = ['Prince', 26, 'New Delhi'] # create a new empty DataFrame with the correct column names df = pd.DataFrame(columns=['Name', 'Age', 'City']) # append the new row to the DataFrame df = df.append(pd.Series(new_row_data, index=df.columns), ignore_index=True) # print the updated DataFrame print(df)
Dans le code ci-dessus, nous importons d'abord la bibliothèque pandas. Ensuite, nous créons une liste appelée "new_row_data" qui contient les valeurs que nous souhaitons ajouter en tant que nouvelles lignes au DataFrame. Nous créons ensuite un nouvel objet DataFrame vide nommé « df » avec les mêmes noms de colonnes que le DataFrame existant.
Ensuite, nous ajoutons de nouvelles lignes au DataFrame en utilisant la méthode « append » de l'objet DataFrame. Nous transmettons l'objet pandas Series à la méthode "append", qui représente notre nouvelle ligne de données. Nous utilisons le paramètre "ignore_index=True" pour garantir que les nouvelles lignes sont ajoutées en tant que nouvelles lignes avec de nouveaux numéros d'index plutôt que d'écraser les lignes existantes.
Enfin, nous imprimons le DataFrame mis à jour pour confirmer que nos nouvelles lignes ont été ajoutées avec succès.
Name Age City 0 Prince 26 New Delhi
Comme vous pouvez le voir dans le résultat ci-dessus, l'ensemble de données structurées sous la forme de DataFrame se compose d'une seule ligne et de trois colonnes, chaque colonne ayant sa propre étiquette. Les étiquettes des colonnes sont Nom, Âge et Ville.
Dans ce tutoriel, nous avons appris comment convertir une liste en lignes DataFrame en Python à l'aide de la bibliothèque Pandas. Nous nous assurons d'abord que pandas est installé sur notre système, puis créons une liste contenant les données que nous souhaitons ajouter en tant que nouvelles lignes au DataFrame. Nous créons ensuite un nouvel objet DataFrame vide avec les mêmes noms de colonnes que le DataFrame existant et ajoutons les nouvelles lignes de données à l'aide de la méthode "append". Nous utilisons le paramètre "ignore_index=True" pour garantir que les nouvelles lignes sont ajoutées en tant que nouvelles lignes avec de nouveaux numéros d'index plutôt que d'écraser les lignes existantes. Nous fournissons un exemple pour chaque méthode utilisée dans ce processus.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!