Pandas と Matplotlib での積み上げ棒のクラスタリング
はじめに
この記事では、同じインデックスと列を共有する複数のデータフレームに対して集合棒を使用した積み上げ棒プロットを作成します。目標は、インデックスごとにクラスター化された積み上げ棒を作成し、視覚化を明確にすることです。
Pandas と Matplotlib の使用
このソリューションは、Pandas と Matplotlib ライブラリの機能を活用します。コードは次のとおりです:
<code class="python">import pandas as pd import matplotlib.cm as cm import matplotlib.pyplot as plt def plot_clustered_stacked(dfall, labels=None, title="multiple stacked bar plot"): n_df = len(dfall) n_col = len(dfall[0].columns) n_ind = len(dfall[0].index) axe = plt.subplot(111) for df in dfall: # for each data frame axe = df.plot(kind="bar", linewidth=0, stacked=True, ax=axe, legend=False, grid=False) h,l = axe.get_legend_handles_labels() # get the handles we want to modify for i in range(0, n_df * n_col, n_col): # len(h) = n_col * n_df for j, pa in enumerate(h[i:i+n_col]): for rect in pa.patches: # for each index rect.set_x(rect.get_x() + 1 / float(n_df + 1) * i / float(n_col)) rect.set_hatch("/" * int(i / n_col)) #edited part rect.set_width(1 / float(n_df + 1)) axe.set_xticks((np.arange(0, 2 * n_ind, 2) + 1 / float(n_df + 1)) / 2.) axe.set_xticklabels(df.index, rotation = 0) axe.set_title(title) # Add invisible data to add another legend n=[] for i in range(n_df): n.append(axe.bar(0, 0, color="gray", hatch="/" * i)) l1 = axe.legend(h[:n_col], l[:n_col]) if labels is not None: l2 = plt.legend(n, labels) axe.add_artist(l1) return axe</code>
この関数を使用するには、データフレームのリストと、ラベルやタイトルなどのオプションの引数を渡すだけです。データフレームを区別するために、ハッチングが付いたクラスター化された積み上げバーが生成されます。
例
この関数を使用した例を次に示します。
<code class="python"># create fake dataframes df1 = pd.DataFrame(np.random.rand(4, 5), index=["A", "B", "C", "D"], columns=["I", "J", "K", "L", "M"]) df2 = pd.DataFrame(np.random.rand(4, 5), index=["A", "B", "C", "D"], columns=["I", "J", "K", "L", "M"]) df3 = pd.DataFrame(np.random.rand(4, 5), index=["A", "B", "C", "D"], columns=["I", "J", "K", "L", "M"]) # plot clustered stacked bar plot_clustered_stacked([df1, df2, df3], ["df1", "df2", "df3"])</code>
追加機能
cmap 引数を渡すことでバーの色をカスタマイズできます:
<code class="python">plot_clustered_stacked([df1, df2, df3], ["df1", "df2", "df3"], cmap=plt.cm.viridis)</code>
結論
この解決策は、クラスター化された積み上げ棒グラフを作成するための柔軟で便利な方法を提供します。データ視覚化の特定の要件を満たすようにコードを簡単に変更できます。
以上がPandas と Matplotlib でクラスター化積み上げ棒プロットを作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。