Jadual Kandungan
1. Pertama sekali, kita perlu tahu perpustakaan mana yang kita gunakan untuk melukis gambar?
matplotlib
Seaborn
Perpustakaan lain termasuk
Langkah 1: Tentukan masalah dan pilih grafik
Langkah 2: Ubah data, gunakan fungsi
Berikut ialah beberapa kaedah penukaran data yang biasa digunakan:
Langkah 3: Tetapan parameter, jelas sepintas lalu
2. Asas lukisan visual
Asas lukisan Matplotlib
Rajah dan Subplot
Warna, penanda dan gaya garis
Skala, label dan legenda
设置标题,轴标签,刻度以及刻度标签
添加图例
注解
保存图表到文件
3、Pandas中的绘图函数
Matplotlib作图
线型图
Series.plot方法的参数
DataFrame.plot方法的参数
柱状图
柱状图有一个非常实用的方法:
Rumah pembangunan bahagian belakang Tutorial Python Tiga langkah untuk visualisasi data Python

Tiga langkah untuk visualisasi data Python

Apr 15, 2023 pm 05:04 PM
python pembelajaran mesin visualisasi data

1. Pertama sekali, kita perlu tahu perpustakaan mana yang kita gunakan untuk melukis gambar?

matplotlib

Pustaka lukisan paling asas dalam Python ialah matplotlib, yang merupakan Python paling asas perpustakaan visualisasi Secara amnya saya bermula dengan visualisasi data Python dari matplotlib, dan kemudian mula berkembang secara menegak dan mendatar.

Seaborn

ialah perpustakaan kesan visualisasi lanjutan berdasarkan matplotlib ia menyasarkan pemilihan ciri pembolehubah dalam perlombongan data dan pembelajaran mesin yang boleh menggunakan kod pendek untuk melukis dan menerangkan lebih banyak Visualisasi data dimensi .

Perpustakaan lain termasuk

Bokeh (pustaka yang digunakan untuk visualisasi interaktif sisi penyemak imbas untuk membolehkan penganalisis berinteraksi dengan data Mapbox (yang mengendalikan enjin data geografi untuk perpustakaan alat visualisasi yang lebih kukuh) dan sebagainya pada.

Artikel ini terutamanya menggunakan matplotlib untuk analisis kes

Langkah 1: Tentukan masalah dan pilih grafik

Perniagaan mungkin rumit, tetapi selepas berpecah, kita perlu mencari kami Apakah isu khusus yang ingin anda nyatakan melalui grafik? Untuk latihan dalam pemikiran analitikal, anda boleh mempelajari kaedah dalam "Kaedah McKinsey" dan "Pyramid Principle".

Ini adalah ringkasan di Internet tentang pemilihan jenis carta.

Tiga langkah untuk visualisasi data Python

Dalam Python, kita boleh meringkaskannya kepada empat elemen visual asas berikut untuk memaparkan grafik:

  • Mata: plot taburan data dua dimensi , Sesuai untuk perhubungan dua dimensi yang mudah;
  • Baris: data dua dimensi plot garis, sesuai untuk siri masa
  • Lajur: data dua dimensi plot, sesuai untuk statistik kategori
  • Warna: peta haba sesuai untuk memaparkan dimensi ketiga;

Terdapat hubungan antara data seperti pengedaran, komposisi, perbandingan, sambungan dan trend yang berubah. Sepadan dengan perhubungan yang berbeza, pilih grafik yang sepadan untuk paparan.

Langkah 2: Ubah data, gunakan fungsi

Banyak kerja pengaturcaraan dalam analisis dan pemodelan data adalah berdasarkan penyediaan data: pemuatan, pembersihan, transformasi dan pembentukan semula . Langkah visualisasi kami juga perlu menyusun data, menukarnya ke dalam format yang kami perlukan, dan kemudian menggunakan kaedah visualisasi untuk melengkapkan lukisan.

Berikut ialah beberapa kaedah penukaran data yang biasa digunakan:

  • Gabung: cantum, concat, combine_frist (serupa dengan gabungan luar penuh dalam pangkalan data)
  • Bentuk semula : bentuk semula; putaran paksi: pangsi (serupa dengan jadual pangsi excel)
  • Alih keluar pendua: drop_duplicates
  • Pemetaan: peta
  • Penggantian isian: fillna,gantikan
  • Namakan semula indeks paksi: namakan semula

Fungsi get_dummies yang menukar pembolehubah kategori kepada 'matriks pembolehubah dummy' dan mengehadkan nilai lajur data dalam df, dsb. Fungsi

mencari fungsi yang sepadan dalam Python berdasarkan grafik yang dipilih dalam langkah pertama.

Langkah 3: Tetapan parameter, jelas sepintas lalu

Selepas grafik asal dilukis, kita boleh mengubah suai warna (warna), gaya garisan (linestyle), penanda (maker) atau lain-lain hiasan carta mengikut keperluan Tajuk item (Tajuk), label paksi (xlabel, ylabel), tanda paksi (set_xticks), dan legenda (legenda), dll., jadikan graf lebih intuitif.

Langkah ketiga ialah mengubah suai grafik berdasarkan langkah kedua untuk menjadikan grafik lebih jelas. Parameter khusus boleh didapati dalam fungsi carta.

2. Asas lukisan visual

Asas lukisan Matplotlib

#导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
Salin selepas log masuk

Rajah dan Subplot

grafik matplotlib kedua-duanya terletak dalam Rajah (kanvas) , Subplot mencipta ruang imej. Anda tidak boleh melukis melalui angka Anda mesti menggunakan add_subplot untuk mencipta satu atau lebih subplot.

figsize boleh menentukan saiz imej.

#创建画布
fig = plt.figure()
<Figure size 432x288 with 0 Axes>
#创建subplot,221表示这是2行2列表格中的第1个图像。
ax1 = fig.add_subplot(221)
#但现在更习惯使用以下方法创建画布和图像,2,2表示这是一个2*2的画布,可以放置4个图像
fig , axes = plt.subplots(2,2,sharex=True,sharey=True)
#plt.subplot的sharex和sharey参数可以指定所有的subplot使用相同的x,y轴刻度。
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

Gunakan kaedah subplots_adjust Rajah untuk melaraskan jarak.

subplots_adjust(left=None,bottom=None,right=None,
top=None,wspace=None,hspace=None)
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

Warna, penanda dan gaya garis

fungsi plot matplotlib menerima set koordinat X dan Y, dan juga boleh menerima singkatan Rentetan untuk warna dan jenis garisan: **'g--', yang bermaksud warna hijau dan jenis garisan ialah '--' garis putus-putus. **Ia juga boleh dinyatakan secara eksplisit menggunakan parameter.

Carta garisan juga boleh menambah beberapa penanda untuk menyerlahkan lokasi titik data. Teg juga boleh diletakkan dalam rentetan format, tetapi jenis teg dan gaya baris mesti datang selepas warna.

plt.plot(np.random.randn(30),color='g',
 linestyle='--',marker='o')
Salin selepas log masuk
[<matplotlib.lines.Line2D at 0x8c919b0>]
Salin selepas log masuk

Skala, label dan legenda

Kaedah xlim, xticks dan xtickslabels plt mengawal julat dan kedudukan tanda carta dan label tandakan masing-masing.

Apabila kaedah dipanggil tanpa parameter, nilai parameter semasa dikembalikan apabila kaedah dipanggil dengan parameter, nilai parameter ditetapkan.

plt.plot(np.random.randn(30),color='g',
 linestyle='--',marker='o')
plt.xlim() #不带参数调用,显示当前参数;
#可将xlim替换为另外两个方法试试
Salin selepas log masuk
(-1.4500000000000002, 30.45)
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

img

plt.plot(np.random.randn(30),color='g',
 linestyle='--',marker='o')
plt.xlim([0,15]) #横轴刻度变成0-15
Salin selepas log masuk
(0, 15)
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

设置标题,轴标签,刻度以及刻度标签

fig = plt.figure();ax = fig.add_subplot(1,1,1)
ax.plot(np.random.randn(1000).cumsum())
ticks = ax.set_xticks([0,250,500,750,1000]) #设置刻度值
labels = ax.set_xticklabels(['one','two','three','four','five']) #设置刻度标签
ax.set_title('My first Plot') #设置标题
ax.set_xlabel('Stage') #设置轴标签
Text(0.5,0,'Stage')
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

添加图例

图例legend是另一种用于标识图标元素的重要工具。 可以在添加subplot的时候传入label参数。

fig = plt.figure(figsize=(12,5));ax = fig.add_subplot(111)
ax.plot(np.random.randn(1000).cumsum(),'k',label='one') #传入label参数,定义label名称
ax.plot(np.random.randn(1000).cumsum(),'k--',label='two')
ax.plot(np.random.randn(1000).cumsum(),'k.',label='three')
#图形创建完后,只需要调用legend参数将label调出来即可。
ax.legend(loc='best') 
#要求不是很严格的话,建议使用loc=‘best’参数来让它自己选择最佳位置
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

注解

除标准的图表对象之外,我们还可以自定义添加一些文字注解或者箭头。

注解可以通过text,arrow和annotate等函数进行添加。text函数可以将文本绘制在指定的x,y坐标位置,还可以进行自定义格式

plt.plot(np.random.randn(1000).cumsum())
plt.text(600,10,'test ',family='monospace',fontsize=10)
#中文注释在默认环境下并不能正常显示,需要修改配置文件,
# 使其支持中文字体。具体步骤请自行搜索。
Salin selepas log masuk

保存图表到文件

利用plt.savefig可以将当前图表保存到文件。例如,要将图表保存为png文件,可以执行

文件类型是根据拓展名而定的。其他参数还有:

  • fname:含有文件路径的字符串,拓展名指定文件类型
  • dpi:分辨率,默认100 facecolor,edgcolor 图像的背景色,默认‘w’白色
  • format:显示设置文件格式('png','pdf','svg','ps','jpg'等)
  • bbox_inches:图表需要保留的部分。如果设置为“tight”,则将尝试剪除图像周围的空白部分
plt.savefig('./plot.jpg') #保存图像为plot名称的jpg格式图像
<Figure size 432x288 with 0 Axes>
Salin selepas log masuk

3、Pandas中的绘图函数

Matplotlib作图

matplotlib是最基础的绘图函数,也是相对较低级的工具。 组装一张图表需要单独调用各个基础组件才行。Pandas中有许多基于matplotlib的高级绘图方法,原本需要多行代码才能搞定的图表,使用pandas只需要短短几行。

我们使用的就调用了pandas中的绘图包。

import matplotlib.pyplot as plt
Salin selepas log masuk

线型图

Series和DataFrame都有一个用于生成各类图表的plot方法。 默认情况下,他们生成的是线型图。

s = pd.Series(np.random.randn(10).cumsum(),index=np.arange(0,100,10))
s.plot() #Series对象的索引index会传给matplotlib用作绘制x轴。
Salin selepas log masuk
<matplotlib.axes._subplots.AxesSubplot at 0xf553128>
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

df = pd.DataFrame(np.random.randn(10,4).cumsum(0),
columns=['A','B','C','D'])
df.plot() #plot会自动为不同变量改变颜色,并添加图例
Salin selepas log masuk
<matplotlib.axes._subplots.AxesSubplot at 0xf4f9eb8>
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

Series.plot方法的参数

  • label:用于图表的标签
  • style:风格字符串,'g--'
  • alpha:图像的填充不透明度(0-1)
  • kind:图表类型(bar,line,hist,kde等)
  • xticks:设定x轴刻度值
  • yticks:设定y轴刻度值
  • xlim,ylim:设定轴界限,[0,10]
  • grid:显示轴网格线,默认关闭
  • rot:旋转刻度标签
  • use_index:将对象的索引用作刻度标签
  • logy:在Y轴上使用对数标尺

DataFrame.plot方法的参数

DataFrame除了Series中的参数外,还有一些独有的选项。

  • subplots:将各个DataFrame列绘制到单独的subplot中
  • sharex,sharey:共享x,y轴
  • figsize:控制图像大小
  • title:图像标题
  • legend:添加图例,默认显示
  • sort_columns:以字母顺序绘制各列,默认使用当前顺序

柱状图

在生成线型图的代码中加上kind=‘bar’或者kind=‘barh’,可以生成柱状图或水平柱状图。

fig,axes = plt.subplots(2,1)
data = pd.Series(np.random.rand(10),index=list('abcdefghij'))
data.plot(kind='bar',ax=axes[0],rot=0,alpha=0.3)
data.plot(kind='barh',ax=axes[1],grid=True)
Salin selepas log masuk
<matplotlib.axes._subplots.AxesSubplot at 0xfe39898>
Salin selepas log masuk

Tiga langkah untuk visualisasi data Python

柱状图有一个非常实用的方法:

利用value_counts图形化显示Series或者DF中各值的出现频率。

比如df.value_counts().plot(kind='bar')

Python可视化的基础语法就到这里,其他图形的绘制方法大同小异。

重点是遵循三个步骤的思路来进行思考、选择、应用。多多练习可以更加熟练。


Atas ialah kandungan terperinci Tiga langkah untuk visualisasi data Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1658
14
Tutorial PHP
1257
29
Tutorial C#
1231
24
PHP dan Python: Paradigma yang berbeza dijelaskan PHP dan Python: Paradigma yang berbeza dijelaskan Apr 18, 2025 am 12:26 AM

PHP terutamanya pengaturcaraan prosedur, tetapi juga menyokong pengaturcaraan berorientasikan objek (OOP); Python menyokong pelbagai paradigma, termasuk pengaturcaraan OOP, fungsional dan prosedur. PHP sesuai untuk pembangunan web, dan Python sesuai untuk pelbagai aplikasi seperti analisis data dan pembelajaran mesin.

Memilih antara php dan python: panduan Memilih antara php dan python: panduan Apr 18, 2025 am 12:24 AM

PHP sesuai untuk pembangunan web dan prototaip pesat, dan Python sesuai untuk sains data dan pembelajaran mesin. 1.Php digunakan untuk pembangunan web dinamik, dengan sintaks mudah dan sesuai untuk pembangunan pesat. 2. Python mempunyai sintaks ringkas, sesuai untuk pelbagai bidang, dan mempunyai ekosistem perpustakaan yang kuat.

PHP dan Python: menyelam mendalam ke dalam sejarah mereka PHP dan Python: menyelam mendalam ke dalam sejarah mereka Apr 18, 2025 am 12:25 AM

PHP berasal pada tahun 1994 dan dibangunkan oleh Rasmuslerdorf. Ia pada asalnya digunakan untuk mengesan pelawat laman web dan secara beransur-ansur berkembang menjadi bahasa skrip sisi pelayan dan digunakan secara meluas dalam pembangunan web. Python telah dibangunkan oleh Guidovan Rossum pada akhir 1980 -an dan pertama kali dikeluarkan pada tahun 1991. Ia menekankan kebolehbacaan dan kesederhanaan kod, dan sesuai untuk pengkomputeran saintifik, analisis data dan bidang lain.

Python vs JavaScript: Keluk Pembelajaran dan Kemudahan Penggunaan Python vs JavaScript: Keluk Pembelajaran dan Kemudahan Penggunaan Apr 16, 2025 am 12:12 AM

Python lebih sesuai untuk pemula, dengan lengkung pembelajaran yang lancar dan sintaks ringkas; JavaScript sesuai untuk pembangunan front-end, dengan lengkung pembelajaran yang curam dan sintaks yang fleksibel. 1. Sintaks Python adalah intuitif dan sesuai untuk sains data dan pembangunan back-end. 2. JavaScript adalah fleksibel dan digunakan secara meluas dalam pengaturcaraan depan dan pelayan.

Cara menjalankan Python Kod Sublime Cara menjalankan Python Kod Sublime Apr 16, 2025 am 08:48 AM

Untuk menjalankan kod python dalam teks luhur, anda perlu memasang plug-in python terlebih dahulu, kemudian buat fail .py dan tulis kod itu, dan akhirnya tekan Ctrl B untuk menjalankan kod, dan output akan dipaparkan dalam konsol.

Di mana untuk menulis kod di vscode Di mana untuk menulis kod di vscode Apr 15, 2025 pm 09:54 PM

Kod penulisan dalam Kod Visual Studio (VSCode) adalah mudah dan mudah digunakan. Hanya pasang VSCode, buat projek, pilih bahasa, buat fail, tulis kod, simpan dan jalankannya. Kelebihan vscode termasuk sumber lintas platform, bebas dan terbuka, ciri-ciri yang kuat, sambungan yang kaya, dan ringan dan cepat.

Bolehkah kod studio visual digunakan dalam python Bolehkah kod studio visual digunakan dalam python Apr 15, 2025 pm 08:18 PM

Kod VS boleh digunakan untuk menulis Python dan menyediakan banyak ciri yang menjadikannya alat yang ideal untuk membangunkan aplikasi python. Ia membolehkan pengguna untuk: memasang sambungan python untuk mendapatkan fungsi seperti penyempurnaan kod, penonjolan sintaks, dan debugging. Gunakan debugger untuk mengesan kod langkah demi langkah, cari dan selesaikan kesilapan. Mengintegrasikan Git untuk Kawalan Versi. Gunakan alat pemformatan kod untuk mengekalkan konsistensi kod. Gunakan alat linting untuk melihat masalah yang berpotensi lebih awal.

Cara menjalankan python dengan notepad Cara menjalankan python dengan notepad Apr 16, 2025 pm 07:33 PM

Running Python Code di Notepad memerlukan Python Executable dan NPPExec plug-in untuk dipasang. Selepas memasang Python dan menambahkan laluannya, konfigurasikan perintah "python" dan parameter "{current_directory} {file_name}" dalam plug-in nppexec untuk menjalankan kod python melalui kunci pintasan "f6" dalam notepad.

See all articles