データ セットを扱うとき、浮動小数点数が数値を表す Excel スタイルでフォーマットされた日付に遭遇することがよくあります。特定のエポック日からの日数。 Pandas は、これらの数値を通常の datetime オブジェクトに変換する便利な方法を提供し、シームレスなデータ操作と分析を可能にします。
提供されたコンテンツで概説されているケースの目的は、Excel スタイルの日付を含む XML ファイルを解析することです。 42580.3333333333 など。これを実現するために、Pandas は TimedeltaIndex を使用した簡単なソリューションを提供します。
import pandas as pd import datetime as dt df = pd.DataFrame({'date': [42580.3333333333, 10023]}) df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)
このコードは、float 値から TimedeltaIndex を構築し、それを 1900 年 1 月 1 日のスカラー日付時刻に追加し、Excel の日付を日付時刻に効果的に変換します。
ただし、Excel では標準とは若干異なるエポック日付が使用されることに注意することが重要です。 datetime オブジェクトなので、結果の日付をそれに応じて調整する必要がある場合があります。これに対処するには、コードを次のように変更できます。
df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)
これにより、Excel スタイルの日付が正しい日時値に変換され、Pandas フレームワーク内で正確なデータ処理と分析が可能になります。
以上がパンダは Excel 形式の日付を効率的に解析するにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。