Python でデータの視覚化と探索を行う方法
Python でデータの視覚化と探索を実行する方法
データの視覚化と探索は、データ分析の重要な側面の 1 つです。Python では、さまざまな強力な機能の助けを借りて、ライブラリとツールを使用すると、データを簡単に視覚化して探索できます。この記事では、Python で一般的に使用されるデータ視覚化ライブラリとテクニックを紹介し、具体的なコード例を示します。
- はじめに
データビジュアライゼーションとは、抽象的なデータを直感的かつ分かりやすく表示する手法です。視覚化により、データの分布、関係、特性をより深く理解できるようになります。 Matplotlib、Seaborn、Plotly など、Python でのデータ視覚化のためのライブラリやツールが多数あります。 - データの準備
データの視覚化を実行する前に、まず分析するデータを準備する必要があります。この記事では、アヤメ データ セットを例に挙げます。アヤメ データ セットは、UCI 機械学習ライブラリの古典的なデータ セットです。これには、3 種類のアヤメの花 (セトーサ、バーシカラー、バージニカ) の 150 個のサンプルが含まれています。各サンプルには、4 つのアヤメの花が含まれています特徴(がく片の長さ、がく片の幅、花弁の長さ、花弁の幅)が含まれています。
まず、データ処理と分析のために pandas ライブラリをインストールする必要があります。次に、次のコードを使用して Iris データ セットを読み取り、簡単なデータ視覚化の準備をします。
import pandas as pd
Iris データ セットを読み取ります
iris_data = pd。 read_csv ('iris.csv')
データセットの最初の数行を表示
print(iris_data.head())
データの基本情報を表示set
print(iris_data.info())
- 単一変数データの視覚化
単一変数データの視覚化とは、単一変数の分布を視覚化することを指します。一般的に使用される方法には、ヒストグラム、ヒストグラム、箱ひげ図などがあります。
がく片の長さ (がくの長さ) を例として、Matplotlib ライブラリを使用してヒストグラムを描画するコード例は次のとおりです。
import matplotlib.pyplot as plt
列を描画する Figure
plt.bar(iris_data['Species'], iris_data['Sepal length'])
plt.xlabel('Species') # X 軸を設定するlabel
plt.ylabel(' セパルの長さ') # y 軸のラベルを設定します
plt.title('セパルの長さの分布') # グラフのタイトルを設定します
plt.show()
さらに、Seaborn ライブラリを使用して、ヒストグラムの図や箱ひげ図を描画することもできます。以下は、ヒストグラムを描画するコード例です。
import seaborn as sns
ヒストグラムの描画
sns.histplot(data=iris_data, x='Sepal length' , kde =True)
plt.xlabel('Sepal length') # x 軸のラベルを設定します
plt.ylabel('Count') # y 軸のラベルを設定します
plt.title('セパルの長さの分布') #Set chart title
plt.show()
- 二重変数データの視覚化
二重変数データの視覚化とは、2 つの変数間の関係を視覚化することを指します。一般的に使用される方法には、散布図やヒート マップなどがあります。
萼片の長さと花弁の長さを例として、Matplotlib ライブラリを使用して散布図を描画するコード例は次のとおりです。
散布図を描画する
plt.scatter( iris_data['がく片の長さ'], iris_data['花びらの長さ'])
plt.xlabel('がく片の長さ') # x 軸のラベルを設定します
plt.ylabel('花びらlength') # y 軸のラベルを設定します
plt.title('セパルの長さと花弁の長さの関係') # グラフのタイトルを設定します
plt.show()
さらに、 Seaborn ライブラリを使用してヒート マップを描画し、変数間の相関関係を示すこともできます。以下は、ヒート マップを描画するコード例です。
変数間の相関係数行列を計算します
correlation_matrix = iris_data[['がく片の長さ', 'がく片の幅', '花弁の長さ' , ' 花びらの幅']].corr()
ヒート マップを描画します
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title( 'Correlation Matrix ')
plt.show()
- 多変数データの視覚化
多変数データの視覚化とは、複数の変数間の関係を視覚化することを指します。一般的に使用される方法には、散布行列と平行座標プロットが含まれます。
アイリス データ セットの 4 つの特徴を例として、Seaborn ライブラリを使用して散布行列を描画するコード例は次のとおりです。
散布図を描画するmath
sns.pairplot(iris_data, hue='Species')
plt.show()
さらに、Plotly ライブラリを使用して平行座標プロットを描画することもできます。以下は、平行座標プロットを描画するためのコード例です。
import plotly.express as px
平行座標グラフを描画
fig = px.Parallel_coodys(iris_data, color=') Species')
fig.show()
まとめ
この記事では、Python でのデータの視覚化と探索の方法を紹介し、具体的なコード例を示します。データの視覚化と探索を通じて、データの分布、関係、特性をより深く理解できるようになり、その後のデータ分析とモデリングのための基盤と指針が提供されます。実際のアプリケーションでは、データの価値をさらに探求するために、特定のニーズとデータ特性に基づいて適切な視覚化方法とテクノロジーを選択することもできます。
以上がPython でデータの視覚化と探索を行う方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











多くのウェブサイト開発者は、ランプアーキテクチャの下でnode.jsまたはPythonサービスを統合する問題に直面しています:既存のランプ(Linux Apache MySQL PHP)アーキテクチャWebサイトのニーズ...

Scapy Crawlerを使用する場合、パイプラインの永続的なストレージファイルを書くことができない理由は?ディスカッションデータクローラーにScapy Crawlerを使用することを学ぶとき、あなたはしばしば...

Pythonクロスプラットフォームデスクトップアプリケーション開発ライブラリの選択多くのPython開発者は、WindowsシステムとLinuxシステムの両方で実行できるデスクトップアプリケーションを開発したいと考えています...

Python Process Poolは、クライアントが立ち往生する原因となる同時TCP要求を処理します。ネットワークプログラミングにPythonを使用する場合、同時のTCP要求を効率的に処理することが重要です。 ...

python functools.partialオブジェクトのpython functools.partialを使用してPythonを使用する視聴方法を深く探索します。

Python:Hourglassグラフィック図面と入力検証この記事では、Python NoviceがHourglass Graphic Drawingプログラムで遭遇する可変定義の問題を解決します。コード...

白い領域を見つけるためにPythonで高解像度の画像を処理する方法は? 9000x7000ピクセルの高解像度画像の処理、2つの写真を正確に見つける方法...

データの変換と統計:大規模なデータセットの効率的な処理この記事では、製品情報を含むデータリストを別の含有しているものに変換する方法を詳細に紹介します...
