如何在Python中使用KNN演算法進行分類?
K近鄰演算法(KNN)是一種簡單有效的演算法,它可以用於分類和迴歸。它的基本思想是透過測量不同特徵之間的距離來識別樣本所屬的類別。在本文中,我們將探討如何在Python中對KNN進行分類。
1.準備資料集
首先,我們需要準備資料集。在本例中,我們將使用Iris資料集,它包含3種不同的鳶尾花(Setosa、Versicolour和Virginica),每種鳶尾花有4個特徵(Sepal Length、Sepal Width、Petal Length、Petal Width)。
我們將使用Pandas函式庫來讀取和預處理資料。首先,我們需要導入所需的函式庫:
import pandas as pd import numpy as np import matplotlib.pyplot as plt
然後,我們將載入資料集:
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class'] dataset = pd.read_csv(url, names=names)
現在,我們有了一個資料集,我們可以開始對其進行探索。
2.資料視覺化
在進行分類之前,我們需要對資料進行視覺化和探索。我們將畫出每個特徵與另一個特徵之間的散佈圖,以及每個特徵的直方圖。我們可以使用Matplotlib庫和Seaborn庫來進行視覺化。
特徵之間的散佈圖:
import seaborn as sns sns.pairplot(dataset, hue="class")
從這張圖中可以看出,不同鳶尾花的特徵有很大的差異,這是進行分類的基礎。
各個特徵的直方圖:
dataset.hist() plt.show()
從這個圖中可以看出,資料集中的每個特徵都有不同的分佈,這是進行標準化的基礎。
3.資料預處理
在進行分類之前,我們需要先對資料進行預處理。我們可以將資料集拆分為輸入特徵和輸出類別,然後將特徵值縮放到0到1的範圍內。
首先,我們將資料集拆分為輸入特徵和輸出類別:
X = dataset.iloc[:, :-1].values y = dataset.iloc[:, 4].values
然後,我們將特徵值縮放到0到1的範圍內:
from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X)
現在,我們有了經過預處理的資料集。
4.拆分資料集
在進行分類之前,我們需要將資料集拆分為訓練集和測試集。我們可以使用Scikit-learn函式庫中的train_test_split函數來完成。
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
這將建立一個訓練集和一個測試集,比例為80:20。
5.訓練KNN模型
現在,我們可以開始訓練KNN模型。我們先匯入KNeighborsClassifier類,建立一個實例,並使用fit函數來擬合模型。
from sklearn.neighbors import KNeighborsClassifier classifier = KNeighborsClassifier(n_neighbors=5) classifier.fit(X_train, y_train)
這將建立一個KNN分類器,並訓練它使用訓練集進行分類。
6.預測
現在,我們可以使用KNN模型對測試集進行預測。我們使用predict函數來進行預測,並將結果保存到一個變數中。
y_pred = classifier.predict(X_test)
7.模型評估
最後,我們需要評估我們的模型並確定其準確性。我們可以使用Scikit-learn函式庫中的confusion_matrix和classification_report函數來評估模型的準確性。
from sklearn.metrics import confusion_matrix, classification_report print(confusion_matrix(y_test, y_pred)) print(classification_report(y_test, y_pred))
這將輸出混淆矩陣和分類報告,顯示我們的模型的準確性。
總結
在Python中使用KNN演算法進行分類需要以下步驟:
1.準備資料集
2.資料視覺化
3.數據預處理
4.分割資料集
5.訓練KNN模型
6.預測
7.模型評估
KNN演算法是簡單有效的演算法,它可以用於分類和回歸。在Python中使用KNN演算法進行分類需要根據上述步驟進行操作。同時,我們也需要進行資料視覺化和預處理,以確保我們的模型能夠準確地進行分類。
以上是如何在Python中使用KNN演算法進行分類?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

VS Code可以在Windows 8上運行,但體驗可能不佳。首先確保系統已更新到最新補丁,然後下載與系統架構匹配的VS Code安裝包,按照提示安裝。安裝後,注意某些擴展程序可能與Windows 8不兼容,需要尋找替代擴展或在虛擬機中使用更新的Windows系統。安裝必要的擴展,檢查是否正常工作。儘管VS Code在Windows 8上可行,但建議升級到更新的Windows系統以獲得更好的開發體驗和安全保障。

VS Code 可用於編寫 Python,並提供許多功能,使其成為開發 Python 應用程序的理想工具。它允許用戶:安裝 Python 擴展,以獲得代碼補全、語法高亮和調試等功能。使用調試器逐步跟踪代碼,查找和修復錯誤。集成 Git,進行版本控制。使用代碼格式化工具,保持代碼一致性。使用 Linting 工具,提前發現潛在問題。

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後,在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。

VS Code 擴展存在惡意風險,例如隱藏惡意代碼、利用漏洞、偽裝成合法擴展。識別惡意擴展的方法包括:檢查發布者、閱讀評論、檢查代碼、謹慎安裝。安全措施還包括:安全意識、良好習慣、定期更新和殺毒軟件。
