pandas DataFrame の溶解には、各列が変数を表すワイド形式からの再構築が含まれます。長い形式に変換します。各行は観測値を表し、各列は特徴量を表します。
DataFrame をメルトするには、次の引数を指定して pd.melt() 関数を使用します。
たとえば、以下を溶かすにはDataFrame:
import pandas as pd df = pd.DataFrame({'Name': ['Bob', 'John', 'Foo', 'Bar', 'Alex', 'Tom'], 'Math': ['A+', 'B', 'A', 'F', 'D', 'C'], 'English': ['C', 'B', 'B', 'A+', 'F', 'A']})
次を使用できます:
df_melted = pd.melt(df, id_vars=['Name'], value_vars=['Math', 'English'])
これにより、溶解された DataFrame が出力されます:
Name variable value 0 Bob Math A+ 1 John Math B 2 Foo Math A 3 Bar Math F 4 Alex Math D 5 Tom Math C 6 Bob English C 7 John English B 8 Foo English B 9 Bar English A+ 10 Alex English F 11 Tom English A
メルティングは、次のような場合に役立ちます。
df = pd.DataFrame({'Name': ['Bob', 'John', 'Foo', 'Bar', 'Alex', 'Tom'], 'Math': ['A+', 'B', 'A', 'F', 'D', 'C'], 'English': ['C', 'B', 'B', 'A+', 'F', 'A']})
df_melted = pd.melt(df, id_vars=['Name', 'Age'], var_name='Subject', value_name='Grade') print(df_melted)
出力:
Name Age Subject Grade 0 Bob 13 English C 1 John 16 English B 2 Foo 16 English B 3 Bar 15 English A+ 4 Alex 17 English F 5 Tom 12 English A 6 Bob 13 Math A+ 7 John 16 Math B 8 Foo 16 Math A 9 Bar 15 Math F 10 Alex 17 Math D 11 Tom 12 Math C
df_melted_math = pd.melt(df, id_vars=['Name', 'Age'], value_vars=['Math'], var_name='Subject', value_name='Grade') print(df_melted_math)
出力:
Name Age Subject Grade 0 Bob 13 Math A+ 1 John 16 Math B 2 Foo 16 Math A 3 Bar 15 Math F 4 Alex 17 Math D 5 Tom 12 Math C
df_melted_grouped = df_melted.groupby(['Grade']).agg({'Name': ', '.join, 'Subject': ', '.join}).reset_index() print(df_melted_grouped)
出力:
Grade Name Subjects 0 A Foo, Tom Math, English 1 A+ Bob, Bar Math, English 2 B John, John, Foo Math, English, English 3 C Bob, Tom English, Math 4 D Alex Math 5 F Bar, Alex Math, English
df_unmelted = df_melted.pivot_table(index=['Name', 'Age'], columns='Subject', values='Grade', aggfunc='first').reset_index() print(df_unmelted)
出力:
Name Age English Math 0 Alex 17 F D 1 Bar 15 A+ F 2 Bob 13 C A+ 3 Foo 16 B A 4 John 16 B B 5 Tom 12 A C
df_melted_by_name = df_melted.groupby('Name').agg({'Subject': ', '.join, 'Grade': ', '.join}).reset_index() print(df_melted_by_name)
出力:
Name Subject Grades 0 Alex Math, English D, F 1 Bar Math, English F, A+ 2 Bob Math, English A+, C 3 Foo Math, English A, B 4 John Math, English B, B 5 Tom Math, English C, A
df_melted_full = df.melt(ignore_index=False) print(df_melted_full)
出力:
Name Age variable value 0 Bob 13 Math A+ 1 John 16 Math B 2 Foo 16 Math A 3 Bar 15 Math F 4 Alex 17 Math D 5 Tom 12 Math C 6 Bob 13 English C 7 John 16 English B 8 Foo 16 English B 9 Bar 15 English A+ 10 Alex 17 English F 11 Tom 12 English A
以上がPandas DataFrame を溶かす方法とこの手法をいつ使用するか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。