Python中的隨機森林演算法實例
隨機森林(Random Forest)是一種整合學習(Ensemble Learning)演算法,其透過結合多個決策樹的預測結果來提高準確性和穩健性。隨機森林在各領域都有廣泛的應用,例如金融、醫療、電商等。
本文將介紹如何使用Python實現隨機森林分類器,並使用鳶尾花資料集進行測試。
一、鳶尾花資料集
鳶尾花資料集是機器學習中一個經典的資料集,包含了150筆記錄,每筆記錄有4個特徵和1個類別標籤。其中4個特徵分別是花萼長度、花萼寬度、花瓣長度和花瓣寬度,類別標籤則表示鳶尾花的三個品種之一(山鳶尾、變色鳶尾、維吉尼亞鳶尾花)。
在Python中,我們可以使用scikit-learn這個強大的機器學習函式庫來載入鳶尾花資料集。具體操作如下:
from sklearn.datasets import load_iris iris = load_iris() X = iris.data y = iris.target
二、建立隨機森林分類器
使用scikit-learn建立隨機森林分類器非常簡單。首先,我們需要從sklearn.ensemble中導入RandomForestClassifier類,並實例化一個物件:
from sklearn.ensemble import RandomForestClassifier rfc = RandomForestClassifier(n_estimators=10)
其中,n_estimators參數指定了隨機森林中包含的決策樹數量。此處,我們將隨機森林中的決策樹數量設定為10。
接著,我們需要將鳶尾花資料集分成訓練資料和測試資料。使用train_test_split函數將資料集隨機劃分為訓練集和測試集:
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
其中,test_size參數指定了測試集所佔比例,random_state參數指定了偽隨機數產生器的種子,以確保每次運行程序得到相同的結果。
然後,我們可以使用訓練資料來訓練隨機森林分類器:
rfc.fit(X_train, y_train)
三、測試隨機森林分類器
一旦分類器已經訓練完畢,我們可以使用測試數據來測試其性能。使用predict函數對測試集進行預測,並使用accuracy_score函數計算模型的準確率:
from sklearn.metrics import accuracy_score y_pred = rfc.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print("Accuracy:", accuracy)
最後,我們可以使用matplotlib庫將分類器的決策邊界可視化,以便更好地理解分類器的行為:
import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5 y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5 z_min, z_max = X[:, 2].min() - .5, X[:, 2].max() + .5 xx, yy, zz = np.meshgrid(np.arange(x_min, x_max, 0.2), np.arange(y_min, y_max, 0.2), np.arange(z_min, z_max, 0.2)) fig = plt.figure() ax = fig.add_subplot(111, projection='3d') Z = rfc.predict(np.c_[xx.ravel(), yy.ravel(), zz.ravel()]) Z = Z.reshape(xx.shape) ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=y) ax.set_xlabel('Sepal length') ax.set_ylabel('Sepal width') ax.set_zlabel('Petal length') ax.set_title('Decision Boundary') ax.view_init(elev=30, azim=120) ax.plot_surface(xx, yy, zz, alpha=0.3, facecolors='blue') plt.show()
上述程式碼將得到一個三維圖像,其中資料點的顏色表示鳶尾花的品種,決策邊界則用半透明的藍色面來表示。
四、總結
本文介紹如何使用Python實作隨機森林分類器,並使用鳶尾花資料集進行測試。由於隨機森林演算法的穩健性和準確性,它在實際應用中有廣泛的應用前景。如果您對該演算法感興趣,建議多實踐並閱讀相關的文獻。
以上是Python中的隨機森林演算法實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

在 Sublime Text 中運行 Python 代碼,需先安裝 Python 插件,再創建 .py 文件並編寫代碼,最後按 Ctrl B 運行代碼,輸出會在控制台中顯示。

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

Golang在性能和可擴展性方面優於Python。 1)Golang的編譯型特性和高效並發模型使其在高並發場景下表現出色。 2)Python作為解釋型語言,執行速度較慢,但通過工具如Cython可優化性能。

在 Visual Studio Code(VSCode)中編寫代碼簡單易行,只需安裝 VSCode、創建項目、選擇語言、創建文件、編寫代碼、保存並運行即可。 VSCode 的優點包括跨平台、免費開源、強大功能、擴展豐富,以及輕量快速。

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後,在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。
