Maison > développement back-end > Tutoriel Python > Comment lire des fichiers CSV à l'aide de la bibliothèque Pandas

Comment lire des fichiers CSV à l'aide de la bibliothèque Pandas

WBOY
Libérer: 2024-01-04 10:08:34
original
1510 Les gens l'ont consulté

Comment lire des fichiers CSV à laide de la bibliothèque Pandas

Comment lire des fichiers CSV avec Pandas

Présentation :
CSV (Comma-Separated Values) est un format de fichier de feuille de calcul courant qui utilise des virgules ou d'autres caractères spécifiques comme séparateurs pour les valeurs de champ. Pandas est une puissante bibliothèque de traitement de données qui peut facilement lire, traiter et analyser divers fichiers de données, y compris les fichiers CSV. Cet article expliquera comment utiliser la bibliothèque Pandas pour lire des fichiers CSV et donnera des exemples de code spécifiques.

Étapes :

  1. Importez les bibliothèques requises

    import pandas as pd
    Copier après la connexion

    Tout d'abord, nous devons importer la bibliothèque Pandas.

  2. Lire le fichier CSV à l'aide de la fonction read_csv de Pandas

    data = pd.read_csv('file_path.csv')
    Copier après la connexion

    Dans cette étape, nous utilisons la fonction read_csv pour lire le fichier CSV. Vous devez remplacer file_path.csv par le chemin et le nom de votre fichier actuel. Cette fonction chargera le contenu du fichier dans un objet DataFrame nommé data.

Si le séparateur de champ dans le fichier CSV n'est pas une virgule, mais d'autres caractères, vous pouvez utiliser le paramètre sep pour spécifier le séparateur. Par exemple, si le délimiteur est un point-virgule, le code est le suivant :

data = pd.read_csv('file_path.csv', sep=';')
Copier après la connexion
  1. Visualisation des données

    print(data.head())
    Copier après la connexion

    En utilisant la fonction head, nous pouvons imprimer les premières lignes de l'ensemble de données afin de visualiser les données contenu. Le paramètre par défaut de la fonction head est 5, indiquant qu'il faut imprimer les cinq premières lignes de données.

  2. Traitement des données
    Une fois les données lues dans l'objet DataFrame, nous pouvons utiliser les différentes fonctions et méthodes fournies par Pandas pour traiter les données. Voici quelques exemples :
  • Afficher les dimensions des données (nombre de lignes et de colonnes)

    print(data.shape)
    Copier après la connexion

    L'attribut shape peut renvoyer les informations de dimension du DataFrame, telles que (nombre de lignes, nombre de colonnes). La propriété

  • Afficher les noms de colonnes

    print(data.columns)
    Copier après la connexion

    columns peut renvoyer la liste des noms de colonnes de DataFrame.

  • Afficher le résumé statistique des données

    print(data.describe())
    Copier après la connexion

    La fonction de description peut renvoyer les informations récapitulatives statistiques des données, y compris la moyenne, l'écart type, la valeur minimale, la valeur maximale, etc.

  • Filtrer les données
    Par exemple, nous pouvons filtrer les données pour obtenir un sous-ensemble de données dans des conditions spécifiques :

    filtered_data = data[data['column_name'] > 10]
    Copier après la connexion

    Dans l'exemple ci-dessus, nous avons filtré les données avec un nom de colonne « nom_colonne » avec une valeur supérieure à 10. .

  • Trier les données

    sorted_data = data.sort_values(by='column_name', ascending=True)
    Copier après la connexion

    Avec la fonction sort_values ​​​​, nous pouvons trier les données, trier en fonction du nom de colonne spécifié et spécifier l'ordre croissant ou décroissant. La fonction

  • Enregistrer les données

    data.to_csv('new_file_path.csv', index=False)
    Copier après la connexion

    to_csv peut enregistrer l'objet DataFrame en tant que nouveau fichier CSV. Vous devez remplacer new_file_path.csv par le nom du fichier et le chemin que vous souhaitez réellement enregistrer. Le paramètre index=False indique que l'index des données n'est pas enregistré.

  • Résumé :
    Cet article présente les étapes d'utilisation de Pandas pour lire des fichiers CSV et donne des exemples de code spécifiques. Pandas fournit une multitude de fonctions et de méthodes permettant de traiter et d'analyser facilement les données. En utilisant ces fonctionnalités, nous pouvons mieux utiliser les données des fichiers CSV.

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal