Maison > développement back-end > Tutoriel Python > Comment lire et manipuler des données CSV à l'aide de la bibliothèque pandas de Python

Comment lire et manipuler des données CSV à l'aide de la bibliothèque pandas de Python

WBOY
Libérer: 2024-01-13 08:20:07
original
1392 Les gens l'ont consulté

Comment lire et manipuler des données CSV à laide de la bibliothèque pandas de Python

Comment utiliser pandas pour lire des fichiers CSV et effectuer un traitement de données

pandas est un puissant outil de traitement et d'analyse de données qui fournit des fonctions de lecture, de manipulation et d'analyse de données dans différents formats. Dans cet article, nous expliquerons comment utiliser les pandas pour lire des fichiers CSV et effectuer le traitement des données.

Tout d’abord, assurez-vous que la bibliothèque pandas est installée. S'il n'est pas encore installé, vous pouvez l'installer en exécutant la commande suivante dans le terminal :

pip install pandas
Copier après la connexion

Ensuite, nous allons faire une démonstration en utilisant l'exemple de fichier CSV suivant :

name,age,city
John,30,New York
Alice,25,Los Angeles
Bob,35,Chicago
Copier après la connexion

Maintenant, commençons à écrire le code pour lire le fichier. et traiter les données.

Tout d'abord, importez la bibliothèque pandas :

import pandas as pd
Copier après la connexion

Ensuite, lisez le fichier CSV à l'aide de la fonction read_csv() : read_csv()函数读取CSV文件:

df = pd.read_csv('data.csv')
Copier après la connexion

这将创建一个名为df的pandas DataFrame对象来存储CSV文件的内容。

如果你想查看读取的数据,可以使用head()函数来显示前几行数据:

print(df.head())
Copier après la connexion

接下来,让我们介绍一些常用的数据处理操作。

  1. 选择列:
    要选择特定的列,可以使用列名称作为索引:
name_column = df['name']
age_column = df['age']
Copier après la connexion
  1. 选择行:
    要选择特定的行,可以使用lociloc函数:
row_0 = df.loc[0]  # 使用索引选择第一行数据
row_1 = df.iloc[1]  # 使用位置选择第二行数据
Copier après la connexion
  1. 筛选数据:
    可以使用条件来筛选满足特定条件的数据:
filtered_data = df[df['age'] > 30]  # 筛选年龄大于30的数据
Copier après la connexion
  1. 添加列:
    可以使用insert()函数添加新的列:
df.insert(3, 'country', ['USA', 'USA', 'USA'])  # 添加一个名为'country'的列,所有行的值都是'USA'
Copier après la connexion
  1. 删除列:
    要删除列,使用drop()函数:
df = df.drop('city', axis=1)  # 删除名为'city'的列
Copier après la connexion
  1. 修改数据:
    要修改数据,可以使用索引或条件进行选择并重新赋值:
df.loc[0, 'age'] = 31  # 修改第一行'age'列的值为31
df['age'] = df['age'] + 1  # 将'age'列的所有值加1
Copier après la connexion

这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。

最后,将数据保存到新的CSV文件中,可以使用to_csv()

df.to_csv('new_data.csv', index=False)  # 将数据保存到名为'new_data.csv'的文件中,不包含行索引
Copier après la connexion
Cela créera un DataFrame pandas nommé df Objet pour stocker le contenu d'un fichier CSV.

Si vous souhaitez afficher les données lues, vous pouvez utiliser la fonction head() pour afficher les premières lignes de données :

rrreee

Ensuite, introduisons quelques opérations courantes de traitement des données. 🎜
  1. Sélectionner des colonnes :
    Pour sélectionner une colonne spécifique, vous pouvez utiliser le nom de la colonne comme index :
rrreee
  1. Sélectionner rows :Pour sélectionner des lignes spécifiques, vous pouvez utiliser la fonction loc ou iloc :
rrreee
  1. Filtrer les données :
    Vous pouvez utiliser des conditions pour filtrer les données qui répondent à des conditions spécifiques :
rrreee
  1. Ajouter des colonnes :
    Vous pouvez utiliser insert() Fonction pour ajouter une nouvelle colonne :
rrreee
  1. Supprimer une colonne :
    Pour supprimer une colonne, utilisez drop()Fonction :
rrreee
  1. Modifier les données :
    Pour modifier les données, vous pouvez utiliser des index ou des conditions pour sélectionner et réaffecter :
  2. ol>rrreee🎜Ce ne sont là que quelques-unes des nombreuses opérations de traitement de données fournies par les pandas. En fonction de vos besoins spécifiques, vous pouvez également effectuer d'autres opérations telles que le tri des données, la fusion de données et le calcul de statistiques. 🎜🎜Enfin, pour enregistrer les données dans un nouveau fichier CSV, vous pouvez utiliser la fonction to_csv() : 🎜rrreee🎜Il s'agit de la méthode de base et de quelques opérations courantes d'utilisation de pandas pour lire des fichiers CSV et effectuer un traitement de données. Grâce à ces opérations, vous pouvez facilement traiter et analyser des données dans une variété de formats différents. 🎜🎜J'espère que cet article vous sera utile et je vous souhaite du succès dans votre parcours de traitement et d'analyse de données ! 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal