對DataFrame 行進行分組以在GroupBy 中建立清單的方法
在使用pandas 進行資料操作的領域中,通常需要操作DataFrame 行成特定格式。一個常見的要求是根據特定列對行進行分組,並以列表的形式從另一列檢索值。
考慮一個包含「a」和「b」列的DataFrame,如下所示:
a b A 1 A 2 B 5 B 5 B 4 C 6
目標是將此DataFrame 轉換為一個新的DataFrame,其中行按列“ a”分組,列“b”中的值轉換為每個組的列表。所需的輸出如下所示:
A [1, 2] B [5, 5, 4] C [6]
為了實現這一點,我們可以利用pandas 的'groupby' 和'apply' 函數,如下所示:
# Import the pandas library import pandas as pd # Create a DataFrame from the provided data df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]}) # Group the DataFrame by column 'a' grouped = df.groupby('a') # Apply the list function to each group to get the 'b' values as lists group_b_lists = grouped['b'].apply(list) # Reset the index of the resulting Series to obtain a DataFrame df_result = group_b_lists.reset_index(name='b_lists') # Print the transformed DataFrame print(df_result)
此程式碼有效地按列「a」對原始DataFrame 進行分組,將列表函數套用到每個群組,並將結果清單指派給名為「b_lists」的新欄位。然後列印生成的 DataFrame 以顯示所需的輸出。
以上是如何將 Pandas DataFrame 行分組並將列值轉換為清單?的詳細內容。更多資訊請關注PHP中文網其他相關文章!