始める前に、Pandas、Matplotlib、Seaborn などの必要なライブラリをインポートする必要があります。これらのライブラリは、次のコマンドを使用してインポートできます。
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
データ視覚化を行う前に、データをロードする必要があります。この例では、Pandas ライブラリの read_csv() 関数を使用して CSV ファイルを読み込みます。サンプル コードは次のとおりです。
data = pd.read_csv('data.csv')
グラフを作成する前に、作成するグラフの種類を決定する必要があります。この記事では、散布図と折れ線グラフを例として使用します。
散布図:
散布図は、2 つの変数間の関係を示すために使用できます。基本的な散布図を作成するコードは次のとおりです。
plt.scatter(data['x'], data['y']) plt.title('Scatter Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
折れ線グラフ:
折れ線グラフは、一連のデータの傾向を示すために使用できます。基本的な折れ線グラフを作成するコードは次のとおりです。
plt.plot(data['x'], data['y']) plt.title('Line Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
基本的なグラフを作成した後、性別をより読みやすくするために詳細を追加できます。よく使用される詳細は次のとおりです。
凡例の追加:
plt.scatter(data['x'], data['y'], label='Data Points') plt.title('Scatter Plot') plt.xlabel('X') plt.ylabel('Y') plt.legend() plt.show()
色とスタイルの変更:
plt.plot(data['x'], data['y'], color='red', linestyle='--', marker='o') plt.title('Line Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
サブ図の追加:
fig, (ax1, ax2) = plt.subplots(1, 2) ax1.scatter(data['x'], data['y']) ax1.set_title('Scatter Plot') ax1.set_xlabel('X') ax1.set_ylabel('Y') ax2.plot(data['x'], data['y']) ax2.set_title('Line Plot') ax2.set_xlabel('X') ax2.set_ylabel('Y') plt.show()
Seaborn は Matplotlib 上に構築されたライブラリであり、より多くの視覚化オプションを提供します。以下は、Seaborn ライブラリを使用して散布図を作成する例です。
sns.scatterplot(data=data, x='x', y='y',hue='category') plt.title('Scatter Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
この散布図は、さまざまなカテゴリをさまざまな色で表すため、さまざまなデータ ポイントを区別しやすくなります。
Seaborn ライブラリの別の例は、sns.lineplot() 関数を使用して折れ線グラフを作成することです:
sns.lineplot(data=data, x='x', y='y') plt.title('Line Plot') plt.xlabel('X') plt.ylabel('Y') plt.show()
Matplotlib と同様に、Seaborn ライブラリは色の変更などの詳細を追加することもできます。やスタイル、サブピクチャの追加など。
以上がPython でデータ視覚化を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。