Comment utiliser le module pandas pour l'analyse de données dans Python 2.x
Présentation :
Dans le processus d'analyse et de traitement des données, pandas est une bibliothèque Python très puissante et couramment utilisée. Il fournit des structures de données et des outils d'analyse de données pour un traitement et une analyse rapides et efficaces des données. Cet article expliquera comment utiliser les pandas pour l'analyse des données dans Python 2.x et fournira aux lecteurs quelques exemples de code.
Installer pandas :
Avant de commencer, vous devez d'abord installer la bibliothèque pandas. Vous pouvez saisir la commande suivante via le terminal ou l'invite de commande pour installer :
pip install pandas
Structure de données :
pandas fournit deux structures de données principales : 1) Série 2) DataFrame ;
Series est une structure de tableau unidimensionnelle indexée, similaire à une colonne dans Excel. Exemple de code :
import pandas as pd # 创建一个Series对象 data = pd.Series([1, 3, 5, np.nan, 6, 8]) print(data)
Résultat de sortie :
0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64
DataFrame est une structure de tableau bidimensionnel, similaire à un tableau dans Excel. Exemple de code :
import pandas as pd import numpy as np # 创建一个DataFrame对象 data = pd.DataFrame({ "A": [1, 2, 3, 4], "B": pd.Timestamp('20130102'), "C": pd.Series(1, index=list(range(4)), dtype='float32'), "D": np.array([3] * 4, dtype='int32'), "E": pd.Categorical(["test", "train", "test", "train"]), "F": 'foo' }) print(data)
Résultats de sortie :
A B C D E F 0 1 2013-01-02 1.0 3 test foo 1 2 2013-01-02 1.0 3 train foo 2 3 2013-01-02 1.0 3 test foo 3 4 2013-01-02 1.0 3 train foo
Lecture et écriture de données :
les pandas peuvent lire et écrire plusieurs formats de données, notamment des fichiers CSV, des fichiers Excel, des bases de données SQL, etc.
Exemple de lecture de fichier CSV :
import pandas as pd # 从CSV文件中读取数据 data = pd.read_csv('data.csv') print(data.head())
Exemple de lecture de fichier Excel :
import pandas as pd # 从Excel文件中读取数据 data = pd.read_excel('data.xlsx') print(data.head())
Analyse et traitement des données :
pandas fournit de nombreuses fonctions et méthodes puissantes pour l'analyse et le traitement des données.
Exemple d'analyse statistique de données :
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 统计描述性统计信息 print(data.describe()) # 计算各列之间的相关系数 print(data.corr())
Exemple de filtrage et de tri des données :
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 筛选出满足条件的数据 filtered_data = data[data['age'] > 30] # 按照某列进行排序 sorted_data = data.sort_values('age') print(filtered_data.head()) print(sorted_data.head())
Exemple de regroupement et d'agrégation de données :
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 按照某一列进行分组 grouped_data = data.groupby('gender') # 计算每组的平均值 mean_data = grouped_data.mean() print(mean_data)
Exemple d'écriture de données dans un fichier CSV ou Excel :
import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 将数据写入到CSV文件中 data.to_csv('output.csv', index=False) # 将数据写入到Excel文件中 data.to_excel('output.xlsx', index=False)
Résumé :
pandas est Python 2.x A bibliothèque d'analyse de données couramment utilisée. Cet article présente la méthode d'installation des pandas et les structures de données courantes, les méthodes de lecture et d'écriture des données, ainsi que les méthodes courantes d'analyse et de traitement des données. Les lecteurs peuvent utiliser les pandas de manière flexible pour l'analyse et le traitement des données en fonction de leurs propres besoins.
Ce qui précède est l'introduction de cet article sur la façon d'utiliser le module pandas pour l'analyse des données dans Python 2.x. J'espère que cela vous sera utile !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!