Maison > développement back-end > Tutoriel Python > Comment utiliser le module pandas pour l'analyse des données dans Python 2.x

Comment utiliser le module pandas pour l'analyse des données dans Python 2.x

王林
Libérer: 2023-08-02 12:39:18
original
977 Les gens l'ont consulté

Comment utiliser le module pandas pour l'analyse de données dans Python 2.x

Présentation :
Dans le processus d'analyse et de traitement des données, pandas est une bibliothèque Python très puissante et couramment utilisée. Il fournit des structures de données et des outils d'analyse de données pour un traitement et une analyse rapides et efficaces des données. Cet article expliquera comment utiliser les pandas pour l'analyse des données dans Python 2.x et fournira aux lecteurs quelques exemples de code.

Installer pandas :
Avant de commencer, vous devez d'abord installer la bibliothèque pandas. Vous pouvez saisir la commande suivante via le terminal ou l'invite de commande pour installer :

pip install pandas
Copier après la connexion

Structure de données :
pandas fournit deux structures de données principales : 1) Série 2) DataFrame ;

Series est une structure de tableau unidimensionnelle indexée, similaire à une colonne dans Excel. Exemple de code :

import pandas as pd

# 创建一个Series对象
data = pd.Series([1, 3, 5, np.nan, 6, 8])

print(data)
Copier après la connexion

Résultat de sortie :

0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64
Copier après la connexion

DataFrame est une structure de tableau bidimensionnel, similaire à un tableau dans Excel. Exemple de code :

import pandas as pd
import numpy as np

# 创建一个DataFrame对象
data = pd.DataFrame({
    "A": [1, 2, 3, 4],
    "B": pd.Timestamp('20130102'),
    "C": pd.Series(1, index=list(range(4)), dtype='float32'),
    "D": np.array([3] * 4, dtype='int32'),
    "E": pd.Categorical(["test", "train", "test", "train"]),
    "F": 'foo'
})

print(data)
Copier après la connexion

Résultats de sortie :

   A          B    C  D      E    F
0  1 2013-01-02  1.0  3   test  foo
1  2 2013-01-02  1.0  3  train  foo
2  3 2013-01-02  1.0  3   test  foo
3  4 2013-01-02  1.0  3  train  foo
Copier après la connexion

Lecture et écriture de données :
les pandas peuvent lire et écrire plusieurs formats de données, notamment des fichiers CSV, des fichiers Excel, des bases de données SQL, etc.

Exemple de lecture de fichier CSV :

import pandas as pd

# 从CSV文件中读取数据
data = pd.read_csv('data.csv')

print(data.head())
Copier après la connexion

Exemple de lecture de fichier Excel :

import pandas as pd

# 从Excel文件中读取数据
data = pd.read_excel('data.xlsx')

print(data.head())
Copier après la connexion

Analyse et traitement des données :
pandas fournit de nombreuses fonctions et méthodes puissantes pour l'analyse et le traitement des données.

Exemple d'analyse statistique de données :

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 统计描述性统计信息
print(data.describe())

# 计算各列之间的相关系数
print(data.corr())
Copier après la connexion

Exemple de filtrage et de tri des données :

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 筛选出满足条件的数据
filtered_data = data[data['age'] > 30]

# 按照某列进行排序
sorted_data = data.sort_values('age')

print(filtered_data.head())
print(sorted_data.head())
Copier après la connexion

Exemple de regroupement et d'agrégation de données :

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 按照某一列进行分组
grouped_data = data.groupby('gender')

# 计算每组的平均值
mean_data = grouped_data.mean()

print(mean_data)
Copier après la connexion

Exemple d'écriture de données dans un fichier CSV ou Excel :

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 将数据写入到CSV文件中
data.to_csv('output.csv', index=False)

# 将数据写入到Excel文件中
data.to_excel('output.xlsx', index=False)
Copier après la connexion

Résumé :
pandas est Python 2.x A bibliothèque d'analyse de données couramment utilisée. Cet article présente la méthode d'installation des pandas et les structures de données courantes, les méthodes de lecture et d'écriture des données, ainsi que les méthodes courantes d'analyse et de traitement des données. Les lecteurs peuvent utiliser les pandas de manière flexible pour l'analyse et le traitement des données en fonction de leurs propres besoins.

Ce qui précède est l'introduction de cet article sur la façon d'utiliser le module pandas pour l'analyse des données dans Python 2.x. J'espère que cela vous sera utile !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal