ホームページ > バックエンド開発 > Python チュートリアル > パンダは Excel 形式の日付を効率的に解析するにはどうすればよいでしょうか?

パンダは Excel 形式の日付を効率的に解析するにはどうすればよいでしょうか?

Mary-Kate Olsen
リリース: 2024-11-26 02:56:17
オリジナル
688 人が閲覧しました

How Can Pandas Efficiently Parse Excel-Style Dates?

Pandas を使用した Excel スタイルの日付の解析

データ セットを扱うとき、浮動小数点数が数値を表す Excel スタイルでフォーマットされた日付に遭遇することがよくあります。特定のエポック日からの日数。 Pandas は、これらの数値を通常の datetime オブジェクトに変換する便利な方法を提供し、シームレスなデータ操作と分析を可能にします。

提供されたコンテンツで概説されているケースの目的は、Excel スタイルの日付を含む XML ファイルを解析することです。 42580.3333333333 など。これを実現するために、Pandas は TimedeltaIndex を使用した簡単なソリューションを提供します。

import pandas as pd
import datetime as dt

df = pd.DataFrame({'date': [42580.3333333333, 10023]})

df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)
ログイン後にコピー

このコードは、float 値から TimedeltaIndex を構築し、それを 1900 年 1 月 1 日のスカラー日付時刻に追加し、Excel の日付を日付時刻に効果的に変換します。

ただし、Excel では標準とは若干異なるエポック日付が使用されることに注意することが重要です。 datetime オブジェクトなので、結果の日付をそれに応じて調整する必要がある場合があります。これに対処するには、コードを次のように変更できます。

df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)
ログイン後にコピー

これにより、Excel スタイルの日付が正しい日時値に変換され、Pandas フレームワーク内で正確なデータ処理と分析が可能になります。

以上がパンダは Excel 形式の日付を効率的に解析するにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート