如何在Python中使用KNN算法进行分类？-Python教程-PHP中文网

首页

后端开发

Python教程

如何在Python中使用KNN算法进行分类？

PHPz

Jun 05, 2023 am 09:02 AM

python 分类 knn算法

K近邻算法（KNN）是一种简单有效的算法，它可以用于分类和回归。它的基本思想是通过测量不同特征之间的距离来识别样本所属的类别。在本文中，我们将探讨如何在Python中对KNN进行分类。

1.准备数据集

首先，我们需要准备数据集。在本例中，我们将使用Iris数据集，它包含3种不同的鸢尾花（Setosa、Versicolour和Virginica），每种鸢尾花有4个特征（Sepal Length、Sepal Width、Petal Length、Petal Width）。

我们将使用Pandas库来读取和预处理数据。首先，我们需要导入所需的库：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

登录后复制

然后，我们将载入数据集：

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']
dataset = pd.read_csv(url, names=names)

登录后复制

现在，我们有了一个数据集，我们可以开始对其进行探索。

2.数据可视化

在进行分类之前，我们需要对数据进行可视化和探索。我们将画出每个特征与另一个特征之间的散点图，以及每个特征的直方图。我们可以使用Matplotlib库和Seaborn库来进行可视化。

特征之间的散点图：

import seaborn as sns
sns.pairplot(dataset, hue="class")

登录后复制

从这个图中可以看出，不同鸢尾花的特征有很大的差异，这是进行分类的基础。

各个特征的直方图：

dataset.hist()
plt.show()

登录后复制

从这个图中可以看出，数据集中的每个特征都具有不同的分布，这是进行标准化的基础。

3.数据预处理

在进行分类之前，我们需要对数据进行预处理。我们可以将数据集拆分为输入特征和输出类别，然后将特征值缩放到0到1的范围内。

首先，我们将数据集拆分为输入特征和输出类别：

X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 4].values

登录后复制

然后，我们将特征值缩放到0到1的范围内：

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)

登录后复制

现在，我们有了经过预处理的数据集。

4.拆分数据集

在进行分类之前，我们需要将数据集拆分为训练集和测试集。我们可以使用Scikit-learn库中的train_test_split函数来完成。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

登录后复制

这将创建一个训练集和一个测试集，比例为80:20。

5.训练KNN模型

现在，我们可以开始训练KNN模型。我们先导入KNeighborsClassifier类，创建一个实例，并使用fit函数拟合模型。

from sklearn.neighbors import KNeighborsClassifier
classifier = KNeighborsClassifier(n_neighbors=5)
classifier.fit(X_train, y_train)

登录后复制

这将创建一个KNN分类器，并训练它使用训练集进行分类。

6.预测

现在，我们可以使用KNN模型对测试集进行预测。我们使用predict函数来进行预测，并将结果保存到一个变量中。

y_pred = classifier.predict(X_test)

登录后复制

7.模型评估

最后，我们需要评估我们的模型并确定其准确性。我们可以使用Scikit-learn库中的confusion_matrix和classification_report函数来评估模型的准确性。

from sklearn.metrics import confusion_matrix, classification_report
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

登录后复制

这将输出混淆矩阵和分类报告，显示我们的模型的准确性。

总结

在Python中使用KNN算法进行分类需要进行以下步骤：

1.准备数据集
2.数据可视化
3.数据预处理
4.拆分数据集
5.训练KNN模型
6.预测
7.模型评估

KNN算法是一种简单有效的算法，它可以用于分类和回归。在Python中使用KNN算法进行分类需要根据上述步骤进行操作。同时，我们也需要进行数据可视化和预处理，以确保我们的模型能够准确地进行分类。

以上是如何在Python中使用KNN算法进行分类？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7667

CakePHP 教程

1393

C# 教程

1205

steam的账户名称是什么格式

win11激活密钥永久

显示更多

Related knowledge

PHP和Python：解释了不同的范例 Apr 18, 2025 am 12:26 AM

PHP主要是过程式编程，但也支持面向对象编程（OOP）；Python支持多种范式，包括OOP、函数式和过程式编程。PHP适合web开发，Python适用于多种应用，如数据分析和机器学习。

在PHP和Python之间进行选择：指南 Apr 18, 2025 am 12:24 AM

PHP适合网页开发和快速原型开发，Python适用于数据科学和机器学习。1.PHP用于动态网页开发，语法简单，适合快速开发。2.Python语法简洁，适用于多领域，库生态系统强大。

visual studio code 可以用于 python 吗 Apr 15, 2025 pm 08:18 PM

VS Code 可用于编写 Python，并提供许多功能，使其成为开发 Python 应用程序的理想工具。它允许用户：安装 Python 扩展，以获得代码补全、语法高亮和调试等功能。使用调试器逐步跟踪代码，查找和修复错误。集成 Git，进行版本控制。使用代码格式化工具，保持代码一致性。使用 Linting 工具，提前发现潜在问题。

vs code 可以在 Windows 8 中运行吗 Apr 15, 2025 pm 07:24 PM

VS Code可以在Windows 8上运行，但体验可能不佳。首先确保系统已更新到最新补丁，然后下载与系统架构匹配的VS Code安装包，按照提示安装。安装后，注意某些扩展程序可能与Windows 8不兼容，需要寻找替代扩展或在虚拟机中使用更新的Windows系统。安装必要的扩展，检查是否正常工作。尽管VS Code在Windows 8上可行，但建议升级到更新的Windows系统以获得更好的开发体验和安全保障。