Dalam artikel ini, kami meneroka pelbagai kaedah untuk mencipta plot serakan dalam perpustakaan matplotlib Python, di mana titik data dikodkan warna berdasarkan tahap kategori yang berbeza.
matplotlib menyediakan parameter c untuk plt.scatter(), yang membenarkan penyesuaian warna. Parameter ini boleh ditetapkan kepada senarai atau kamus yang memetakan nilai kategori kepada warna.
<code class="python">import matplotlib.pyplot as plt import pandas as pd # Load data df = pd.read_csv("diamonds.csv") # Create a color map colors = {'D':'tab:blue', 'E':'tab:orange', 'F':'tab:green', 'G':'tab:red', 'H':'tab:purple', 'I':'tab:brown', 'J':'tab:pink'} # Plot data with color mapping plt.scatter(df['carat'], df['price'], c=df['color'].map(colors)) plt.show()</code>
Seaborn ialah perpustakaan yang menyediakan API ringkas untuk mencipta grafik statistik dengan matplotlib. Untuk membuat plot taburan dengan titik data berkod warna menggunakan seaborn, gunakan fungsi sns.lmplot() dengan fit_reg=False untuk melumpuhkan regresi.
<code class="python">import seaborn as sns # Plot data with color-coding sns.lmplot(x='carat', y='price', data=df, hue='color', fit_reg=False)</code>
Jika anda memilih untuk tidak menggunakan seaborn, anda boleh mencapai hasil yang sama secara manual menggunakan pandas.groupby() dan panda.DataFrame.plot(). Kaedah ini melibatkan pengumpulan data mengikut warna dan kemudian memplot setiap kumpulan secara individu dengan warna yang ditentukan.
<code class="python">fig, ax = plt.subplots() grouped = df.groupby('color') for key, group in grouped: group.plot(ax=ax, kind='scatter', x='carat', y='price', label=key, color=colors[key])</code>
Dengan melaksanakan teknik ini, anda boleh mencipta plot serakan bermaklumat yang secara visual mewakili hubungan antara tahap kategori yang berbeza.
Atas ialah kandungan terperinci Bagaimana untuk Memplot Kategori Data Berbeza dengan Warna dalam Matplotlib dan Seaborn?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!