如何用Python的Pandas库处理Excel数据？-Python教程-PHP中文网

1、读取xlsx表格：pd.read_excel()

2、获取表格的数据大小：shape

3、索引数据的方法：[ ] / loc[] / iloc[]

4、判断数据为空：np.isnan() / pd.isnull()

5、查找符合条件的数据

6、修改元素值：replace()

7、增加数据：[ ]

8、删除数据：del() / drop()

9、保存到excel文件：to_excel()

首页

后端开发

Python教程

如何用Python的Pandas库处理Excel数据？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 08, 2023 pm 09:49 PM

excel python pandas

1、读取xlsx表格：pd.read_excel()

原始内容如下：

怎么使用python pandas处理excel表格数据

a）读取第n个Sheet（子表，在左下方可以查看或增删子表）的数据

import pandas as pd
# 每次都需要修改的路径
path = "test.xlsx"
# sheet_name默认为0，即读取第一个sheet的数据
sheet = pd.read_excel(path, sheet_name=0)
print(sheet)
"""
  Unnamed: 0  name1  name2  name3
0       row1      1    2.0      3
1       row2      4    NaN      6
2       row3      7    8.0      9
"""

登录后复制

可以注意到，原始表格左上角没有填入内容，读取的结果是“Unnamed: 0” ，这是由于read_excel函数会默认把表格的第一行为列索引名。另外，对于行索引名来说，默认从第二行开始编号（因为默认第一行是列索引名，所以默认第一行不是数据），如果不特意指定，则自动从0开始编号，如下。

sheet = pd.read_excel(path)
# 查看列索引名，返回列表形式
print(sheet.columns.values)
# 查看行索引名，默认从第二行开始编号，如果不特意指定，则自动从0开始编号，返回列表形式
print(sheet.index.values)
"""
[&#39;Unnamed: 0&#39; &#39;name1&#39; &#39;name2&#39; &#39;name3&#39;]
[0 1 2]
"""

登录后复制

b）列索引名还可以自定义，如下：

sheet = pd.read_excel(path, names=[&#39;col1&#39;, &#39;col2&#39;, &#39;col3&#39;, &#39;col4&#39;])
print(sheet)
# 查看列索引名，返回列表形式
print(sheet.columns.values)
"""
   col1  col2  col3  col4
0  row1     1   2.0     3
1  row2     4   NaN     6
2  row3     7   8.0     9
[&#39;col1&#39; &#39;col2&#39; &#39;col3&#39; &#39;col4&#39;]
"""

登录后复制

c）也可以指定第n列为行索引名，如下：

# 指定第一列为行索引
sheet = pd.read_excel(path, index_col=0)
print(sheet)
"""
      name1  name2  name3
row1      1    2.0      3
row2      4    NaN      6
row3      7    8.0      9
"""

登录后复制

d）读取时跳过第n行的数据

# 跳过第2行的数据（第一行索引为0）
sheet = pd.read_excel(path, skiprows=[1])
print(sheet)
"""
  Unnamed: 0  name1  name2  name3
0       row2      4    NaN      6
1       row3      7    8.0      9
"""

登录后复制

2、获取表格的数据大小：shape

path = "test.xlsx"
# 指定第一列为行索引
sheet = pd.read_excel(path, index_col=0)
print(sheet)
print(&#39;==========================&#39;)
print(&#39;shape of sheet:&#39;, sheet.shape)
"""
      name1  name2  name3
row1      1    2.0      3
row2      4    NaN      6
row3      7    8.0      9
==========================
shape of sheet: (3, 3)
"""

登录后复制

3、索引数据的方法：[ ] / loc[] / iloc[]

1、直接加方括号索引

可以使用方括号加列名的方式 [col_name] 来提取某列的数据，然后再用方括号加索引数字 [index] 来索引这列的具体位置的值。这里索引名为name1的列，然后打印位于该列第1行（索引是1）位置的数据：4，如下：

sheet = pd.read_excel(path)
# 读取列名为 name1 的列数据
col = sheet[&#39;name1&#39;]
print(col)
# 打印该列第二个数据
print(col[1]) # 4
"""
0    1
1    4
2    7
Name: name1, dtype: int64
4
"""

登录后复制

2、iloc方法，按整数编号索引

使用 sheet.iloc[ ] 索引，方括号内为行列的整数位置编号（除去作为行索引的那一列和作为列索引的哪一行后，从 0 开始编号）。
a）sheet.iloc[1, 2] ：提取第2行第3列数据。第一个是行索引，第二个是列索引

b）sheet.iloc[0: 2] ：提取前两行数据

c）sheet.iloc[0:2, 0:2] ：通过分片的方式提取 前两行 的 前两列 数据

# 指定第一列数据为行索引
sheet = pd.read_excel(path, index_col=0)
# 读取第2行（row2）的第3列（6）数据
# 第一个是行索引，第二个是列索引
data = sheet.iloc[1, 2]
print(data)  # 6
print(&#39;================================&#39;)
# 通过分片的方式提取 前两行 数据
data_slice = sheet.iloc[0:2]
print(data_slice)
print(&#39;================================&#39;)
# 通过分片的方式提取 前两行 的 前两列 数据
data_slice = sheet.iloc[0:2, 0:2]
print(data_slice)
"""
6
================================
      name1  name2  name3
row1      1    2.0      3
row2      4    NaN      6
================================
      name1  name2
row1      1    2.0
row2      4    NaN
"""

登录后复制

3、loc方法，按行列名称索引

使用 sheet.loc[ ] 索引，方括号内为行列的名称字符串。具体使用方式同 iloc ，只是把 iloc 的整数索引替换成了行列的名称索引。这种索引方式用起来更直观。

注意：iloc[1: 2] 是不包含2的，但是 loc['row1': 'row2'] 是包含 'row2' 的。

# 指定第一列数据为行索引
sheet = pd.read_excel(path, index_col=0)
# 读取第2行（row2）的第3列（6）数据
# 第一个是行索引，第二个是列索引
data = sheet.loc[&#39;row2&#39;, &#39;name3&#39;]
print(data)  # 1
print(&#39;================================&#39;)
# 通过分片的方式提取 前两行 数据
data_slice = sheet.loc[&#39;row1&#39;: &#39;row2&#39;]
print(data_slice)
print(&#39;================================&#39;)
# 通过分片的方式提取 前两行 的 前两列 数据
data_slice1 = sheet.loc[&#39;row1&#39;: &#39;row2&#39;, &#39;name1&#39;: &#39;name2&#39;]
print(data_slice1)
"""
6
================================
      name1  name2  name3
row1      1    2.0      3
row2      4    NaN      6
================================
      name1  name2
row1      1    2.0
row2      4    NaN
"""

登录后复制

4、判断数据为空：np.isnan() / pd.isnull()

1、使用 numpy 库的 isnan() 或 pandas 库的 isnull() 方法判断是否等于 nan 。

sheet = pd.read_excel(path)
# 读取列名为 name1 的列数据
col = sheet[&#39;name2&#39;]
 
print(np.isnan(col[1]))  # True
print(pd.isnull(col[1]))  # True
"""
True
True
"""

登录后复制

2、使用 str() 转为字符串，判断是否等于 'nan' 。

sheet = pd.read_excel(path)
# 读取列名为 name1 的列数据
col = sheet[&#39;name2&#39;]
print(col)
# 打印该列第二个数据
if str(col[1]) == &#39;nan&#39;:
    print(&#39;col[1] is nan&#39;)
"""
0    2.0
1    NaN
2    8.0
Name: name2, dtype: float64
col[1] is nan
"""

登录后复制

5、查找符合条件的数据

下面的代码意会一下吧

# 提取name1 == 1 的行
mask = (sheet[&#39;name1&#39;] == 1)
x = sheet.loc[mask]
print(x)
"""
      name1  name2  name3
row1      1    2.0      3
"""

登录后复制

6、修改元素值：replace()

sheet['name2'].replace(2, 100, inplace=True) ：把 name2 列的元素 2 改为元素 100，原位操作。

sheet[&#39;name2&#39;].replace(2, 100, inplace=True)
print(sheet)
"""
      name1  name2  name3
row1      1  100.0      3
row2      4    NaN      6
row3      7    8.0      9
"""

登录后复制

sheet['name2'].replace(np.nan, 100, inplace=True) ：把 name2 列的空元素（nan）改为元素 100，原位操作。

import numpy as np 
sheet[&#39;name2&#39;].replace(np.nan, 100, inplace=True)
print(sheet)
print(type(sheet.loc[&#39;row2&#39;, &#39;name2&#39;]))
"""
      name1  name2  name3
row1      1    2.0      3
row2      4  100.0      6
row3      7    8.0      9
"""

登录后复制

7、增加数据：[ ]

增加列，直接使用中括号 [ 要添加的名字 ] 添加。

sheet['name_add'] = [55, 66, 77] ：添加名为 name_add 的列，值为[55, 66, 77]

path = "test.xlsx"
# 指定第一列为行索引
sheet = pd.read_excel(path, index_col=0)
print(sheet)
print(&#39;====================================&#39;)
# 添加名为 name_add 的列，值为[55, 66, 77]
sheet[&#39;name_add&#39;] = [55, 66, 77]
print(sheet)
"""
      name1  name2  name3
row1      1    2.0      3
row2      4    NaN      6
row3      7    8.0      9
====================================
      name1  name2  name3  name_add
row1      1    2.0      3        55
row2      4    NaN      6        66
row3      7    8.0      9        77
"""

登录后复制

8、删除数据：del() / drop()

a）del(sheet['name3']) ：使用 del 方法删除

sheet = pd.read_excel(path, index_col=0)
# 使用 del 方法删除 &#39;name3&#39; 的列
del(sheet[&#39;name3&#39;])
print(sheet)
"""
      name1  name2
row1      1    2.0
row2      4    NaN
row3      7    8.0
"""

登录后复制

b）sheet.drop('row1', axis=0)

使用 drop 方法删除 row1 行，删除列的话对应的 axis=1。

当 inplace 参数为 True 时，不会返回参数，直接在原数据上删除

当 inplace 参数为 False （默认）时不会修改原数据，而是返回修改后的数据

sheet.drop(&#39;row1&#39;, axis=0, inplace=True)
print(sheet)
"""
      name1  name2  name3
row2      4    NaN      6
row3      7    8.0      9
"""

登录后复制

c）sheet.drop(labels=['name1', 'name2'], axis=1)

使用 label=[ ] 参数可以删除多行或多列

# 删除多列，默认 inplace 参数位 False，即会返回结果
print(sheet.drop(labels=[&#39;name1&#39;, &#39;name2&#39;], axis=1))
"""
      name3
row1      3
row2      6
row3      9
"""

登录后复制

9、保存到excel文件：to_excel()

1、把 pandas 格式的数据另存为 .xlsx 文件

names = [&#39;a&#39;, &#39;b&#39;, &#39;c&#39;]
scores = [99, 100, 99]
result_excel = pd.DataFrame()
result_excel["姓名"] = names
result_excel["评分"] = scores
# 写入excel
result_excel.to_excel(&#39;test3.xlsx&#39;)

登录后复制

怎么使用python pandas处理excel表格数据

2、把改好的 excel 文件另存为 .xlsx 文件。

比如修改原表格中的 nan 为 100 后，保存文件：

import numpy as np 
# 指定第一列为行索引
sheet = pd.read_excel(path, index_col=0)
sheet[&#39;name2&#39;].replace(np.nan, 100, inplace=True)
sheet.to_excel(&#39;test2.xlsx&#39;)

登录后复制

打开 test2.xlsx 结果如下：

怎么使用python pandas处理excel表格数据

以上是如何用Python的Pandas库处理Excel数据？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7487

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

mysql 是否要付费 Apr 08, 2025 pm 05:36 PM

MySQL 有免费的社区版和收费的企业版。社区版可免费使用和修改，但支持有限，适合稳定性要求不高、技术能力强的应用。企业版提供全面商业支持，适合需要稳定可靠、高性能数据库且愿意为支持买单的应用。选择版本时考虑的因素包括应用关键性、预算和技术技能。没有完美的选项，只有最合适的方案，需根据具体情况谨慎选择。

mysql安装后怎么使用 Apr 08, 2025 am 11:48 AM

文章介绍了MySQL数据库的上手操作。首先，需安装MySQL客户端，如MySQLWorkbench或命令行客户端。1.使用mysql-uroot-p命令连接服务器，并使用root账户密码登录；2.使用CREATEDATABASE创建数据库，USE选择数据库；3.使用CREATETABLE创建表，定义字段及数据类型；4.使用INSERTINTO插入数据，SELECT查询数据，UPDATE更新数据，DELETE删除数据。熟练掌握这些步骤，并学习处理常见问题和优化数据库性能，才能高效使用MySQL。

如何针对高负载应用程序优化 MySQL 性能？ Apr 08, 2025 pm 06:03 PM

MySQL数据库性能优化指南在资源密集型应用中，MySQL数据库扮演着至关重要的角色，负责管理海量事务。然而，随着应用规模的扩大，数据库性能瓶颈往往成为制约因素。本文将探讨一系列行之有效的MySQL性能优化策略，确保您的应用在高负载下依然保持高效响应。我们将结合实际案例，深入讲解索引、查询优化、数据库设计以及缓存等关键技术。1.数据库架构设计优化合理的数据库架构是MySQL性能优化的基石。以下是一些核心原则：选择合适的数据类型选择最小的、符合需求的数据类型，既能节省存储空间，又能提升数据处理速度

HadiDB：Python 中的轻量级、可水平扩展的数据库 Apr 08, 2025 pm 06:12 PM

HadiDB：轻量级、高水平可扩展的Python数据库HadiDB(hadidb)是一个用Python编写的轻量级数据库，具备高度水平的可扩展性。安装HadiDB使用pip安装：pipinstallhadidb用户管理创建用户：createuser()方法创建一个新用户。authentication()方法验证用户身份。fromhadidb.operationimportuseruser_obj=user("admin","admin")user_obj.

mysql 需要互联网吗 Apr 08, 2025 pm 02:18 PM

MySQL 可在无需网络连接的情况下运行，进行基本的数据存储和管理。但是，对于与其他系统交互、远程访问或使用高级功能（如复制和集群）的情况，则需要网络连接。此外，安全措施（如防火墙）、性能优化（选择合适的网络连接）和数据备份对于连接到互联网的 MySQL 数据库至关重要。

Navicat查看MongoDB数据库密码的方法 Apr 08, 2025 pm 09:39 PM

直接通过 Navicat 查看 MongoDB 密码是不可能的，因为它以哈希值形式存储。取回丢失密码的方法：1. 重置密码；2. 检查配置文件（可能包含哈希值）；3. 检查代码（可能硬编码密码）。

mysql workbench 可以连接到 mariadb 吗 Apr 08, 2025 pm 02:33 PM

MySQL Workbench 可以连接 MariaDB，前提是配置正确。首先选择 "MariaDB" 作为连接器类型。在连接配置中，正确设置 HOST、PORT、USER、PASSWORD 和 DATABASE。测试连接时，检查 MariaDB 服务是否启动，用户名和密码是否正确，端口号是否正确，防火墙是否允许连接，以及数据库是否存在。高级用法中，使用连接池技术优化性能。常见错误包括权限不足、网络连接问题等，调试错误时仔细分析错误信息和使用调试工具。优化网络配置可以提升性能

mysql 需要服务器吗 Apr 08, 2025 pm 02:12 PM

对于生产环境，通常需要一台服务器来运行 MySQL，原因包括性能、可靠性、安全性和可扩展性。服务器通常拥有更强大的硬件、冗余配置和更严格的安全措施。对于小型、低负载应用，可在本地机器运行 MySQL，但需谨慎考虑资源消耗、安全风险和维护成本。如需更高的可靠性和安全性，应将 MySQL 部署到云服务器或其他服务器上。选择合适的服务器配置需要根据应用负载和数据量进行评估。

See all articles

如何用Python的Pandas库处理Excel数据？

1、读取xlsx表格：pd.read_excel()

2、获取表格的数据大小：shape

3、索引数据的方法：[ ] / loc[] / iloc[]

4、判断数据为空：np.isnan() / pd.isnull()

5、查找符合条件的数据

6、修改元素值：replace()

7、增加数据：[ ]

8、删除数据：del() / drop()

9、保存到excel文件：to_excel()

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题