他の DataFrame 行フィルターに基づいて列を作成するにはどうすればよいですか?

WBOY
リリース: 2024-02-09 13:30:04
転載
535 人が閲覧しました

如何基于其他 DataFrame 行过滤器创建列?

質問の内容

「hourly_data」という名前の遅延フレームがあり、これには「time」という時間ごとの日時列が含まれています。 また、「future_periods」というデータフレームにも、「start」(将来の期間の開始日時)と「end」(将来の期間の終了時刻)という 2 つの日時列が含まれています。重要なのは、これらの将来の期間が重複しないことです。

hourly_data の遅延フレームに「period」という列を作成したいのですが、期間 (future_periods データフレーム行、期間が 10 ある場合は 0 から 9) の時間列の値に基づいた int 値が必要です。hourly_data の値は次のとおりです。 future_periods の開始列値と終了列値の間。

次のことを試してみました:

リーリー

しかし、これによりエラーが発生します: typeerror: Calling series constructionor with unsupported type 'expr' for values argument

私が達成したいこと: 入力:### リーリー

出力:

periods = pl.series(range(future_periods.height))
hourly_data = hourly_data.with_columns(
    (
        pl.when(((future_periods.get_column('start') <= pl.col('time')) & (pl.col('time') <= future_periods.get_column('end'))).any())
        .then(periods.filter(pl.series((future_periods.get_column('start') <= pl.col('real_time')) & (pl.col('real_time') <= future_periods.get_column('end')))).to_list()[0])
        .otherwise(none)
    ).alias('period')
)
ログイン後にコピー


正解


一般的に言えば、これは不等結合、またはあなたの場合は範囲​​結合です。ここではその方法の 1 つを紹介します。まずサンプル データを作成しましょう:

リーリー

これで、2 つのステップで実行できるようになります。まず、

time と将来の期間 id: の間のリンクを計算します。 リーリー

その後、元のデータ フレームと結合できます:

リーリー

これを行うもう 1 つの方法は、

duckdb Polars との統合に感謝します : リーリー

以上が他の DataFrame 行フィルターに基づいて列を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:stackoverflow.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!