首页 > 后端开发 > Python教程 > 如何在 Pandas 中高效选择特定日期范围内的 DataFrame 行?

如何在 Pandas 中高效选择特定日期范围内的 DataFrame 行?

Patricia Arquette
发布: 2024-12-14 08:36:16
原创
397 人浏览过

How to Efficiently Select DataFrame Rows Within a Specific Date Range in Pandas?

选择两个日期之间的 DataFrame 行

简介

处理时间序列数据时,通常需要根据日期范围选择特定行。本文探讨了在 pandas DataFrames 中实现此目的的两种方法。

方法 1:布尔掩码

  1. 确保日期列是具有 dtype 的 Series datetime64[ns]:

    df['date'] = pd.to_datetime(df['date'])
    登录后复制
  2. 使用比较运算符与开始日期和结束日期创建布尔掩码:

    mask = (df['date'] > start_date) & (df['date'] <= end_date)
    登录后复制
  3. 选择子 DataFrame 使用mask:

    df.loc[mask]
    登录后复制
  4. (可选)将子 DataFrame 重新分配给 df。

方法 2:DatetimeIndex

  1. 将日期列设置为索引:

    df = df.set_index(['date'])
    登录后复制
  2. 使用日期范围对 DataFrame 进行切片:

    df.loc[start_date:end_date]
    登录后复制

示例

考虑一个带有日期列的 DataFrame。以下代码使用布尔掩码方法选择 '2000-06-01' 和 '2000-06-10' 之间的行:

import pandas as pd

df = pd.DataFrame({
    'date': pd.date_range('2000-1-1', periods=200, freq='D'),
    'value': np.random.rand(200)
})

mask = (df['date'] > '2000-06-01') & (df['date'] <= '2000-06-10')
result_df = df[mask]
登录后复制

结果包括从 6 月 1 日到 10 日的行, 2000.

比较

  • 布尔掩码方法更灵活,允许更复杂的日期比较。
  • DatetimeIndex 方法更快用于重复的日期范围选择。
  • 在中使用 parse_dates pd.read_csv 可以省去将日期列转换为 datetime64s 的需要。

以上是如何在 Pandas 中高效选择特定日期范围内的 DataFrame 行?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板