简介
在 Pandas 中,融化数据框涉及将数据从宽格式转换为长格式格式,使其可用于各种数据操作任务。本文将引导您完成融合数据框的过程,并通过实际示例探索不同的场景。
问题 1:转置列数据
目标: 在重复原始列的同时将列转置为行
解决方案:
df.melt(id_vars=['Name', 'Age'], var_name='Subject', value_name='Grades')
此代码将创建一个包含“Subject”和“Grades”列的新数据框,而原始列名称将重复对于每个row.
示例:
df = pd.DataFrame({'Name': ['Bob', 'John', 'Foo', 'Bar', 'Alex', 'Tom'], 'Math': ['A+', 'B', 'A', 'F', 'D', 'C'], 'English': ['C', 'B', 'B', 'A+', 'F', 'A'], 'Age': [13, 16, 16, 15, 15, 13]}) melted_df = df.melt(id_vars=['Name', 'Age'], var_name='Subject', value_name='Grades') print(melted_df)
输出:
Name Age Subject Grades 0 Bob 13 English C 1 John 16 English B ... 11 Tom 13 Math C
问题 2:过滤列
目标:熔化特定列,排除其他列。
解决方案:
df.melt(id_vars=['Name', 'Age'], value_vars='Math', var_name='Subject', value_name='Grades')
在此例如,只有“数学”列被熔化,而“年龄”和“姓名”被保留作为标识符。
示例:
melted_df = df.melt(id_vars=['Name', 'Age'], value_vars='Math', var_name='Subject', value_name='Grades') print(melted_df)
输出:
Name Age Subject Grades 0 Bob 13 Math A+ 1 John 16 Math B ...
问题 3:分组并订购融化的数据
目标:将融化的数据分组并按值排序。
解决方案:
melted_df.groupby('value', as_index=False).agg({ 'Subject': ', '.join, 'Grades': ', '.join }).sort_values('value', ascending=True)
此代码将按分数对融化的数据进行分组,并将“科目”和“成绩”值与逗号。
示例:
grouped_df = melted_df.groupby('value', as_index=False).agg({ 'Subject': ', '.join, 'Grades': ', '.join }).sort_values('value', ascending=True) print(grouped_df)
输出:
value Name Subjects 0 A Foo, Tom Math, English 1 A+ Bob, Bar Math, English 2 B John, John, Foo Math, English, English ...
问题 4:不融化数据框
目标:反转熔化过程,返回原始格式。
解决方案:
melted_df.pivot_table("Grades", ['Name', 'Age'], 'Subject', aggfunc='first').reset_index()
此代码会将融化的数据框旋转回原始宽度
示例:
unmelted_df = melted_df.pivot_table("Grades", ['Name', 'Age'], 'Subject', aggfunc='first').reset_index() print(unmelted_df)
输出:
Name Age Math English 0 Alex 15 D F 1 Bar 15 F A+ 2 Bob 13 A+ C 3 Foo 16 A B ...
问题 5:分组和组合列
目标:按特定列对数据进行分组,并用逗号将其他列组合起来。
解决方案:
melted_df.groupby('Name', as_index=False).agg( Subjects=', '.join, Grades=', '.join )
此代码将按“名称”对数据进行分组,并将“主题”和带逗号的“成绩”。
示例:
grouped_df = melted_df.groupby('Name', as_index=False).agg( Subjects=', '.join, Grades=', '.join ) print(grouped_df)
输出:
Name Subjects Grades 0 Alex Math, English D, F 1 Bar Math, English F, A+ 2 Bob Math, English A+, C ...
问题6:全部融化列
目标:将所有列转换为行,包括标识符。
解决方案:
df.melt(var_name='Column', value_name='Value')
此代码会将所有列融合为行,将所有数据视为值。
示例:
melted_df = df.melt(var_name='Column', value_name='Value') print(melted_df)
输出:
Column Value 0 Age 16 1 Age 16 2 Age 15 ... 11 English C 12 Math A 13 Math A+
以上是如何有效地融化和解冻 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!