如何最佳化 Pandas 中的 DataFrame 迭代?

Barbara Streisand
發布: 2024-11-13 08:44:02
原創
217 人瀏覽過

How Can I Optimize DataFrame Iteration in Pandas?

最佳化 Pandas 中的 DataFrame 迭代

按順序迭代資料幀以執行複雜分析是金融資料處理中的常見任務。雖然使用 enumerate() 和 df.values 提供的程式碼提供了一種簡單的方法,但它引發了關於其效率的問題。

為了解決這個問題,pandas 提供了專門的解決方案。 iterrows() 函數允許直接迭代資料幀行,傳回索引元組和對應的行值。此方法:

for index, row in df.iterrows():
    # perform analysis based on index and row values
登入後複製

為了提高效能,itertuples() 函數提供了 iterrows() 的記憶體高效替代方案。

另外,一個高效的方法是直接利用 numpy 函數在資料幀列上,完全避免行迭代。 numpy 運算元用於整個列,從而實現更快的向量化計算。例如,要計算平均開盤價:

import numpy as np
mean_open = np.mean(df['Open'])
登入後複製

以上是如何最佳化 Pandas 中的 DataFrame 迭代?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板