如何在Python中使用KNN演算法進行分類？-Python教學-PHP中文網

首頁

後端開發

Python教學

如何在Python中使用KNN演算法進行分類？

PHPz

Jun 05, 2023 am 09:02 AM

python 分類 knn演算法

K近鄰演算法（KNN）是一種簡單有效的演算法，它可以用於分類和迴歸。它的基本思想是透過測量不同特徵之間的距離來識別樣本所屬的類別。在本文中，我們將探討如何在Python中對KNN進行分類。

1.準備資料集

首先，我們需要準備資料集。在本例中，我們將使用Iris資料集，它包含3種不同的鳶尾花（Setosa、Versicolour和Virginica），每種鳶尾花有4個特徵（Sepal Length、Sepal Width、Petal Length、Petal Width）。

我們將使用Pandas函式庫來讀取和預處理資料。首先，我們需要導入所需的函式庫：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

登入後複製

然後，我們將載入資料集：

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']
dataset = pd.read_csv(url, names=names)

登入後複製

現在，我們有了一個資料集，我們可以開始對其進行探索。

2.資料視覺化

在進行分類之前，我們需要對資料進行視覺化和探索。我們將畫出每個特徵與另一個特徵之間的散佈圖，以及每個特徵的直方圖。我們可以使用Matplotlib庫和Seaborn庫來進行視覺化。

特徵之間的散佈圖：

import seaborn as sns
sns.pairplot(dataset, hue="class")

登入後複製

從這張圖中可以看出，不同鳶尾花的特徵有很大的差異，這是進行分類的基礎。

各個特徵的直方圖：

dataset.hist()
plt.show()

登入後複製

從這個圖中可以看出，資料集中的每個特徵都有不同的分佈，這是進行標準化的基礎。

3.資料預處理

在進行分類之前，我們需要先對資料進行預處理。我們可以將資料集拆分為輸入特徵和輸出類別，然後將特徵值縮放到0到1的範圍內。

首先，我們將資料集拆分為輸入特徵和輸出類別：

X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 4].values

登入後複製

然後，我們將特徵值縮放到0到1的範圍內：

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)

登入後複製

現在，我們有了經過預處理的資料集。

4.拆分資料集

在進行分類之前，我們需要將資料集拆分為訓練集和測試集。我們可以使用Scikit-learn函式庫中的train_test_split函數來完成。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

登入後複製

這將建立一個訓練集和一個測試集，比例為80:20。

5.訓練KNN模型

現在，我們可以開始訓練KNN模型。我們先匯入KNeighborsClassifier類，建立一個實例，並使用fit函數來擬合模型。

from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier(n_neighbors=5)
classifier.fit(X_train, y_train)

登入後複製

這將建立一個KNN分類器，並訓練它使用訓練集進行分類。

6.預測

現在，我們可以使用KNN模型對測試集進行預測。我們使用predict函數來進行預測，並將結果保存到一個變數中。

y_pred = classifier.predict(X_test)

登入後複製

7.模型評估

最後，我們需要評估我們的模型並確定其準確性。我們可以使用Scikit-learn函式庫中的confusion_matrix和classification_report函數來評估模型的準確性。

from sklearn.metrics import confusion_matrix, classification_report
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

登入後複製

這將輸出混淆矩陣和分類報告，顯示我們的模型的準確性。

總結

在Python中使用KNN演算法進行分類需要以下步驟：

1.準備資料集
2.資料視覺化
3.數據預處理
4.分割資料集
5.訓練KNN模型
6.預測
7.模型評估

KNN演算法是簡單有效的演算法，它可以用於分類和回歸。在Python中使用KNN演算法進行分類需要根據上述步驟進行操作。同時，我們也需要進行資料視覺化和預處理，以確保我們的模型能夠準確地進行分類。

以上是如何在Python中使用KNN演算法進行分類？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7773

Java教學

1644

CakePHP 教程

1399

Laravel 教程

1296

PHP教程

1234

Related knowledge

PHP和Python：解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程，但也支持面向對象編程（OOP）；Python支持多種範式，包括OOP、函數式和過程式編程。 PHP適合web開發，Python適用於多種應用，如數據分析和機器學習。

在PHP和Python之間進行選擇：指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發，Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發，語法簡單，適合快速開發。 2.Python語法簡潔，適用於多領域，庫生態系統強大。

Python vs. JavaScript：學習曲線和易用性 Apr 16, 2025 am 12:12 AM

Python更適合初學者，學習曲線平緩，語法簡潔；JavaScript適合前端開發，學習曲線較陡，語法靈活。 1.Python語法直觀，適用於數據科學和後端開發。 2.JavaScript靈活，廣泛用於前端和服務器端編程。

PHP和Python：深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年，由RasmusLerdorf開發，最初用於跟踪網站訪問者，逐漸演變為服務器端腳本語言，廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發，1991年首次發布，強調代碼可讀性和簡潔性，適用於科學計算、數據分析等領域。

vs code 可以在 Windows 8 中運行嗎 Apr 15, 2025 pm 07:24 PM

VS Code可以在Windows 8上運行，但體驗可能不佳。首先確保系統已更新到最新補丁，然後下載與系統架構匹配的VS Code安裝包，按照提示安裝。安裝後，注意某些擴展程序可能與Windows 8不兼容，需要尋找替代擴展或在虛擬機中使用更新的Windows系統。安裝必要的擴展，檢查是否正常工作。儘管VS Code在Windows 8上可行，但建議升級到更新的Windows系統以獲得更好的開發體驗和安全保障。

visual studio code 可以用於 python 嗎 Apr 15, 2025 pm 08:18 PM

VS Code 可用於編寫 Python，並提供許多功能，使其成為開發 Python 應用程序的理想工具。它允許用戶：安裝 Python 擴展，以獲得代碼補全、語法高亮和調試等功能。使用調試器逐步跟踪代碼，查找和修復錯誤。集成 Git，進行版本控制。使用代碼格式化工具，保持代碼一致性。使用 Linting 工具，提前發現潛在問題。

notepad 怎麼運行python Apr 16, 2025 pm 07:33 PM

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後，在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”，即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。

vscode 擴展是否是惡意的 Apr 15, 2025 pm 07:57 PM

VS Code 擴展存在惡意風險，例如隱藏惡意代碼、利用漏洞、偽裝成合法擴展。識別惡意擴展的方法包括：檢查發布者、閱讀評論、檢查代碼、謹慎安裝。安全措施還包括：安全意識、良好習慣、定期更新和殺毒軟件。

See all articles

如何在Python中使用KNN演算法進行分類？

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題