组合列以在 Pandas DataFrame 中创建新的周期列
在 pandas 中,您可能会遇到需要组合列以创建新周期列的情况。创建一个新列,通常表示它们值的组合。考虑这样一个场景,您有一个包含“Year”和“quarter”列的 DataFrame,如下所示:
Year quarter 2000 q2 2001 q3
您想要创建一个名为“period”的新列,该列组合了“Year”中的值' 和 'quarter' 列,生成的 DataFrame 如下所示:
Year quarter period 2000 q2 2000q2 2001 q3 2001q3
组合字符串列
如果 'Year' 和 'quarter' 都是字符串,您可以使用 ' ' 运算符直接连接它们:
df["period"] = df["Year"] + df["quarter"]
组合非字符串列
如果“年份”或“季度”不是string,需要先将其转换为字符串,如下所示:
df["period"] = df["Year"].astype(str) + df["quarter"]
注意:执行此操作时请注意 NaN 值。
使用 agg 组合多个字符串列
如果要组合多个字符串列,您可以使用 'agg' 函数应用连接操作:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
在本例中,'-' 是用于连接列的分隔符。
按照以下步骤,您可以有效地组合 pandas DataFrame 中的列以创建一个代表其值组合的新列。
以上是如何组合 Pandas DataFrame 列来创建新的周期列?的详细内容。更多信息请关注PHP中文网其他相关文章!