如何通过 AcctName 将大型 Pandas DataFrame 有效地切成块?
Pandas - 按 AcctName 将大型数据帧切成块
在数据分析中,使用大型数据帧通常会导致内存错误。为了解决这个问题,将数据帧分割成更小的、可管理的块可能是一个有价值的策略。本文探讨了如何根据特定列(特别是 AcctName)有效地将大型数据帧分割成块。
您可以使用列表理解来实现此切片:
<code class="python">import numpy as np import pandas as pd # Define the chunk size n = 200,000 # Create a list to store the chunks list_df = [] # Extract unique AcctName values AcctNames = df['AcctName'].unique() # Create a dictionary of dataframes for each AcctName DataFrameDict = {acct: pd.DataFrame for acct in AcctNames} # Split the dataframe into chunks by AcctName for acct in DataFrameDict.keys(): DataFrameDict[acct] = df[df['AcctName'] == acct] # Apply your function to the chunk trans_times_2(DataFrameDict[acct]) list_df.append(DataFrameDict[acct]) # Rejoin the chunks into a single dataframe rejoined_df = pd.concat(list_df)</code>
登录后复制
或者,您可以利用 NumPy 的 array_split 函数:
<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>
登录后复制
此方法创建一个块列表,您可以单独访问它。
要重新组装原始数据帧,只需使用 pd.concat:
<code class="python">rejoined_df = pd.concat(list_df)</code>
登录后复制
通过利用这些技术,您可以有效地将大型数据帧分割成更小的块,应用必要的转换,然后将结果数据重新组装成单个数据帧。这种方法可以显着减少内存使用并提高数据处理操作的效率。
以上是如何通过 AcctName 将大型 Pandas DataFrame 有效地切成块?的详细内容。更多信息请关注PHP中文网其他相关文章!
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章
R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前
By 尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
3 周前
By 尊渡假赌尊渡假赌尊渡假赌
击败分裂小说需要多长时间?
3 周前
By DDD
R.E.P.O.保存文件位置:在哪里以及如何保护它?
3 周前
By DDD

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)