이 기사에서는 Python의 matplotlib 라이브러리에서 산점도를 생성하는 다양한 방법을 살펴봅니다. 데이터 포인트는 다양한 범주 수준에 따라 색상으로 구분됩니다.
matplotlib는 색상 사용자 정의가 가능한 plt.scatter()에 대한 c 매개변수를 제공합니다. 이 매개변수는 카테고리 값을 색상에 매핑하는 목록이나 사전으로 설정할 수 있습니다.
<code class="python">import matplotlib.pyplot as plt import pandas as pd # Load data df = pd.read_csv("diamonds.csv") # Create a color map colors = {'D':'tab:blue', 'E':'tab:orange', 'F':'tab:green', 'G':'tab:red', 'H':'tab:purple', 'I':'tab:brown', 'J':'tab:pink'} # Plot data with color mapping plt.scatter(df['carat'], df['price'], c=df['color'].map(colors)) plt.show()</code>
Seaborn은 matplotlib로 통계 그래픽을 생성하기 위한 간결한 API를 제공하는 라이브러리입니다. seaborn을 사용하여 색상으로 구분된 데이터 포인트가 있는 분산형 차트를 생성하려면 fit_reg=False와 함께 sns.lmplot() 함수를 사용하여 회귀를 비활성화합니다.
<code class="python">import seaborn as sns # Plot data with color-coding sns.lmplot(x='carat', y='price', data=df, hue='color', fit_reg=False)</code>
seaborn을 사용하지 않으려면 pandas.groupby() 및 pandas.DataFrame.plot()을 사용하여 수동으로 동일한 결과를 얻을 수 있습니다. 이 방법에는 데이터를 색상별로 그룹화한 다음 각 그룹을 지정된 색상으로 개별적으로 구성하는 작업이 포함됩니다.
<code class="python">fig, ax = plt.subplots() grouped = df.groupby('color') for key, group in grouped: group.plot(ax=ax, kind='scatter', x='carat', y='price', label=key, color=colors[key])</code>
이러한 기술을 구현하면 다양한 범주 수준 간의 관계를 시각적으로 나타내는 유용한 산점도를 생성할 수 있습니다.
위 내용은 Matplotlib 및 Seaborn에서 색상을 사용하여 다양한 데이터 범주를 그리는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!