在 pandas 中,資料操作通常涉及組合列以獲得有意義的見解。當我們需要合併文字列以建立新的文字列時,就會出現這樣的情況。
考慮以下包含兩個文字列「年份」和「季度」的資料框:
Year quarter 2000 q2 2001 q3
我們的目標是建立一個名為「period」的新列,它將“Year”和“quarter”列組合起來,以獲得諸如“2000q2”和"20 01q3."
要實現此目的,如果「Year」和「quarter」列都是字串,我們可以直接連接它們:
df["period"] = df["Year"].astype(str) + df["quarter"]
但是,如果其中一列或兩列都不是字串字串,我們必須在連接之前將它們轉換為字串。例如:
df["period"] = df["Year"].astype(str) + df["quarter"]
執行此操作時必須小心 NaN 值,因為它們可能會導致意外結果。
或者,如果需要連接多個字串列, agg 方法可能很有用:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
在這種情況下,「-」用作分隔符,但您可以自定義它根據需要。
以上是如何組合 Pandas DataFrame 中的文字列來建立新列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!