首頁 後端開發 Python教學 python中預處理以及熱圖的簡單介紹

python中預處理以及熱圖的簡單介紹

Oct 11, 2018 pm 04:29 PM
python

這篇文章帶給大家的內容是關於python中預處理以及熱圖的簡單介紹,有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。

在資料分析當中的東西還是很多的,我在這裡只是啟發式的介紹一下,了解到這方面的東西之後,使用的時候可以更快的找到解決辦法,希望能對大家有幫助。

這次,依然是使用的sklearn中的iris資料集,對其進行透過熱圖來展示。

預處理

sklearn.preprocessing是機器學習庫中預處理的模組,可以對資料進行標準化處理,正規化等等,根據需求來使用。在這裡利用它的標準化方法對資料進行整理。其他的方法可以自行查詢。

Standardization標準化:將特徵資料的分佈調整成標準常態分佈,也叫高斯分佈,也就是使得資料的平均值為0,變異數為1。

標準化的原因在於如果有些特徵的變異數過大,則會主導目標函數從而使參數估計器無法正確地去學習其他特徵。

標準化的過程為兩個步驟:去平均值的中心化(平均值變成0);變異數的規模化(變異數變成1)。

在sklearn.preprocessing中提供了一個scale的方法,可以實現以上功能。

下面舉個例子來看一下:

from sklearn import preprocessing
import numpy as np
# 创建一组特征数据,每一行表示一个样本,每一列表示一个特征
xx = np.array([[1., -1., 2.],
              [2., 0., 0.],
              [0., 1., -1.]])
# 将每一列特征标准化为标准正太分布,注意,标准化是针对每一列而言的
xx_scale = preprocessing.scale(xx)
xx_scale
登入後複製

經過對每列資料進行標準化處理之後的結果是:

array([[ 0.        , -1.22474487,  1.33630621],
       [ 1.22474487,  0.        , -0.26726124],
       [-1.22474487,  1.22474487, -1.06904497]])
登入後複製

可以看到,裡面的資料發生了變化,數值比較小,也許有人可以一眼看出來,看不出來也沒關係,Python可以很方便的計算他們的一些統計量。

 # 测试一下xx_scale每列的均值方差
 print('均值:', xx_scale.mean(axis=0))  # axis=0指列,axis=1指行
 print('方差:', xx_scale.std(axis=0))
登入後複製

上面已經介紹了標準化的是要將它轉換成什麼樣,結果的確吻合,按列求均值和方差的結果為:

均值: [0. 0. 0.]
方差: [1. 1. 1.]
登入後複製

當然對於標準化其方差和均值也不是一定要一起進行,例如有時候僅僅希望利於其中一個方法,也是有辦法的:

with_mean,with_std.這兩個都是布爾型的參數,默認情況下都是true,但也可以自訂成false.即不要均值中心化或不要方差規模化為1.

#熱圖

關於熱圖在這裡只簡單提一下,因為網路上關於它的資料已經很多很詳細了。

在熱圖中,資料以矩陣的形式存在,屬性範圍以顏色的漸變來表示,在這裡,使用pcolor繪製熱圖。

小栗子

還是從導庫開始,然後載入資料集,對資料進行處理,然後繪製圖像,並對圖像做一些標註裝飾等等。我習慣在程式碼中做註釋,如果有不懂的,可以留言,我會及時回覆。

# 导入后续所需要的库
from sklearn.datasets import load_iris
from sklearn.preprocessing import scale
import numpy as np
import matplotlib.pyplot as plt
# 加载数据集
data = load_iris()
x = data['data']
y = data['target']
col_names = data['feature_names']
# 数据预处理
# 根据平均值对数据进行缩放
x = scale(x, with_std=False)
x_ = x[1:26,] # 选取其中25组数据
y_labels = range(1, 26)
# 绘制热图
plt.close('all')
plt.figure(1)
fig, ax = plt.subplots()
ax.pcolor(x_, cmap=plt.cm.Greens, edgecolors='k')
ax.set_xticks(np.arange(0, x_.shape[1])+0.5) # 设置横纵坐标
ax.set_yticks(np.arange(0, x_.shape[0])+0.5)
ax.xaxis.tick_top() # x轴提示显示在图形上方
ax.yaxis.tick_left() # y轴提示显示在图形的左侧
ax.set_xticklabels(col_names, minor=False, fontsize=10) # 传递标签数据
ax.set_yticklabels(y_labels, minor=False, fontsize=10)
plt.show()
登入後複製

那麼繪製出來的圖像是什麼樣子的呢:


#上面簡單的幾步就把這些數據繪製出直覺的圖像,當然,在真正使用的時候不會這麼簡單,還需要多擴充知識。

#

以上是python中預處理以及熱圖的簡單介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

PHP和Python:解釋了不同的範例 PHP和Python:解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

在PHP和Python之間進行選擇:指南 在PHP和Python之間進行選擇:指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

PHP和Python:深入了解他們的歷史 PHP和Python:深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

Python vs. JavaScript:學習曲線和易用性 Python vs. JavaScript:學習曲線和易用性 Apr 16, 2025 am 12:12 AM

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

vs code 可以在 Windows 8 中運行嗎 vs code 可以在 Windows 8 中運行嗎 Apr 15, 2025 pm 07:24 PM

VS Code可以在Windows 8上運行,但體驗可能不佳。首先確保系統已更新到最新補丁,然後下載與系統架構匹配的VS Code安裝包,按照提示安裝。安裝後,注意某些擴展程序可能與Windows 8不兼容,需要尋找替代擴展或在虛擬機中使用更新的Windows系統。安裝必要的擴展,檢查是否正常工作。儘管VS Code在Windows 8上可行,但建議升級到更新的Windows系統以獲得更好的開發體驗和安全保障。

sublime怎麼運行代碼python sublime怎麼運行代碼python Apr 16, 2025 am 08:48 AM

在 Sublime Text 中運行 Python 代碼,需先安裝 Python 插件,再創建 .py 文件並編寫代碼,最後按 Ctrl B 運行代碼,輸出會在控制台中顯示。

visual studio code 可以用於 python 嗎 visual studio code 可以用於 python 嗎 Apr 15, 2025 pm 08:18 PM

VS Code 可用於編寫 Python,並提供許多功能,使其成為開發 Python 應用程序的理想工具。它允許用戶:安裝 Python 擴展,以獲得代碼補全、語法高亮和調試等功能。使用調試器逐步跟踪代碼,查找和修復錯誤。集成 Git,進行版本控制。使用代碼格式化工具,保持代碼一致性。使用 Linting 工具,提前發現潛在問題。

vscode在哪寫代碼 vscode在哪寫代碼 Apr 15, 2025 pm 09:54 PM

在 Visual Studio Code(VSCode)中編寫代碼簡單易行,只需安裝 VSCode、創建項目、選擇語言、創建文件、編寫代碼、保存並運行即可。 VSCode 的優點包括跨平台、免費開源、強大功能、擴展豐富,以及輕量快速。

See all articles