データを散布図としてプロットすることは、広く使用されている視覚化手法です。ただし、大規模なデータセットの場合、ヒートマップはより簡潔で直感的な表現を提供します。この記事では、汎用性の高い Matplotlib ライブラリを使用して、散在データをヒートマップに変換する方法について説明します。
提供されたサンプル データは、10,000 個の X、Y データ ポイントで構成されています。 Matplotlib の組み込みヒートマップ機能には前処理されたセル値が必要なため、生の散乱データからヒートマップを生成することが困難です。
この制限を克服するには、NumPy のヒストグラム2d関数。このメソッドは、二次元ヒストグラムを作成することによってデータ ポイントの確率密度を推定します。
import numpy as np import matplotlib.pyplot as plt # Generate test data x = np.random.randn(8873) y = np.random.randn(8873) # Create a 50x50 heatmap heatmap, xedges, yedges = np.histogram2d(x, y, bins=50) extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]] plt.imshow(heatmap.T, extent=extent, origin='lower') plt.show()
関数 histogram2d は、データを離散ビンに量子化し、色の強度が各ビンのデータ ポイントの頻度を表すヒートマップを作成します。 cell.
ビンの数を調整することで、ヒートマップ解像度を変更できます。
# Create a 512x384 heatmap heatmap, xedges, yedges = np.histogram2d(x, y, bins=(512, 384))
さらに、Matplotlib を使用すると、ヒートマップ スタイルを広範囲にカスタマイズできます。これには、配色、補間方法、注釈が含まれます。さらなるカスタマイズ オプションについては、Matplotlib のドキュメントを参照してください。
以上がMatplotlib を使用して散在データをヒートマップに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。