Pandas DataFrames の複数の列の最大値を見つける
データ分析では、複数の列にわたる最大値を見つけるのが一般的なタスクです。 Python では、Pandas ライブラリは、このような操作を実行するための効率的なメソッドを提供します。
問題ステートメント:
列 A と B を持つ DataFrame があるとします。新しい列 C を作成します。ここで、各値は列 A と列 B の対応する値の最大値になります。
解決策:
Pandas を使用すると、最大値を簡単に計算できます。 max 関数を使用して複数の列を分割します。次の手順は、列 C の作成方法の概要です。
import pandas as pd
列 A と B を持つ DataFrame を作成します。例:
df = pd.DataFrame({"A": [1, 2, 3], "B": [-2, 8, 1]})
比較する列で max 関数を使用し、axis=1 を指定して各行の最大値を計算します。
max_values = df[["A", "B"]].max(axis=1)
計算された最大値を新しい列 C として DataFrame に追加します:
df["C"] = max_values
結果の DataFrame df には 3 つの列が含まれます: A、B 、および C。列 C には、対応する A 値と B 値の最大値が含まれます。
単純な解決策 (2 つの列のみの場合):
2 つしかない場合
df["C"] = df.max(axis=1)
これは、列 A と B が DataFrame 内の唯一の列であることを前提としています。
追加の注意事項:
以上がPandas DataFrame の複数の列にわたる最大値を見つける方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。