Lisez des fichiers CSV et effectuez une analyse de données à l'aide de pandas

王林
Libérer: 2024-01-09 09:26:07
original
1507 Les gens l'ont consulté

Lisez des fichiers CSV et effectuez une analyse de données à laide de pandas

Pandas est un puissant outil d'analyse de données qui peut facilement lire et traiter différents types de fichiers de données. Parmi eux, les fichiers CSV sont l’un des formats de fichiers de données les plus courants et les plus utilisés. Cet article expliquera comment utiliser Pandas pour lire des fichiers CSV et effectuer une analyse de données, et fournira des exemples de code spécifiques.

1. Importez les bibliothèques nécessaires
Tout d'abord, nous devons importer la bibliothèque Pandas et les autres bibliothèques associées qui peuvent être nécessaires, comme indiqué ci-dessous :

import pandas as pd
Copier après la connexion

2. Lisez le fichier CSV
Utilisez la fonction read_csv() de Pandas pour lisez le fichier CSV. Dans la fonction, nous devons fournir le chemin du fichier CSV en paramètre, un exemple est le suivant :

data = pd.read_csv('data.csv')
Copier après la connexion

Dans le code ci-dessus, nous supposons que le nom du fichier CSV est data.csv et est placé dans le même répertoire que le fichier de code Python. Vous pouvez modifier le chemin en fonction de la situation réelle.

3. Comprendre les données
Avant d'analyser les données, nous devons d'abord comprendre la situation de base des données. Pandas propose diverses méthodes pour nous aider à obtenir rapidement des informations pertinentes sur les données.

  1. Afficher les premières lignes des données
    Nous pouvons utiliser la fonction head() pour afficher les premières lignes des données. Les 5 premières lignes sont affichées par défaut :
print(data.head())
Copier après la connexion
  1. . Afficher les informations de base des données
    Utilisez la fonction info() Vous pouvez afficher les informations de base des données, y compris le type de données de chaque colonne, le nombre de valeurs non nulles, etc. :
print(data.info())
Copier après la connexion
  1. Voir le résumé statistique des données
    Utilisez la fonction décrire() pour obtenir le résumé statistique des données, y compris les décomptes, les moyennes, les normes Différence, valeur minimale, 25 %, médiane, 75 %, valeur maximale, etc. :
print(data.describe())
Copier après la connexion

IV. Analyse des données
Avant d'analyser les données, nous devrons peut-être effectuer un prétraitement sur les données, comme le traitement des valeurs manquantes, la gestion des valeurs aberrantes, etc. On suppose ici que les données ont été prétraitées et qu'il n'y a aucune valeur manquante ou valeur aberrante dans les données.

Voici quelques exemples d'opérations d'analyse de données couramment utilisées :

  1. Calculer la somme d'une certaine colonne
    Utilisez la fonction sum() pour calculer la somme d'une certaine colonne. L'exemple est le suivant :
total = data['column_name'].sum()
print('The total is:', total)
Copier après la connexion

. Dans le code ci-dessus, nous allons "column_name" avec le nom de la colonne réelle à calculer.

  1. Calculer la moyenne d'une certaine colonne
    Utilisez la fonction Mean() pour calculer la moyenne d'une certaine colonne. L'exemple est le suivant :
average = data['column_name'].mean()
print('The average is:', average)
Copier après la connexion
  1. Calculez les valeurs maximales et minimales d'une certaine colonne
    . Utilisez les fonctions max() et min() Les valeurs maximales et minimales d'une certaine colonne peuvent être calculées séparément. L'exemple est le suivant :
max_value = data['column_name'].max()
min_value = data['column_name'].min()
print('The maximum value is:', max_value)
print('The minimum value is:', min_value)
Copier après la connexion
  1. Comptez les valeurs uniques d'une certaine colonne
    Utilisez le. Fonction unique() pour compter les valeurs uniques d'une certaine colonne. L'exemple est le suivant :
unique_values = data['column_name'].unique()
print('The unique values are:', unique_values)
Copier après la connexion

5. Enregistrer les résultats
Si nous devons enregistrer les résultats de l'analyse, nous pouvons utiliser la fonction to_csv(). pour enregistrer les résultats sous forme de fichier CSV. L'exemple est le suivant :

result.to_csv('result.csv', index=False)
Copier après la connexion

Dans le code ci-dessus, nous enregistrons les résultats de l'analyse sous le fichier result.csv.

6. Résumé
Cet article explique comment utiliser Pandas pour lire des fichiers CSV et effectuer une analyse de données. Nous avons d'abord importé les bibliothèques nécessaires, puis lu le fichier CSV via la fonction read_csv() et utilisé les fonctions head(), info() etscribe() pour comprendre la situation de base des données. Ensuite, nous fournissons quelques exemples d'opérations d'analyse de données, notamment le calcul de la somme, des valeurs moyennes, maximales et minimales d'une colonne et le comptage des valeurs uniques d'une colonne. Enfin, nous avons également présenté comment enregistrer les résultats de l'analyse sous forme de fichier CSV. J'espère que cet article pourra vous aider à vous sentir plus à l'aise avec Pandas pour l'analyse des données.

Ce qui précède est une introduction à la façon dont Pandas lit les fichiers CSV et effectue l'analyse des données. J'espère que cela vous sera utile !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!