如何在Python中将Scikit-learn的IRIS数据集转换为只有两个特征的数据集？-Python教程-PHP中文网

步骤

示例

输出

如何将 Iris 数据集转换为 3 特征数据集？

首页

后端开发

Python教程

如何在Python中将Scikit-learn的IRIS数据集转换为只有两个特征的数据集？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 30, 2023 pm 09:49 PM

数据集转换特征

如何在Python中将Scikit-learn的IRIS数据集转换为只有两个特征的数据集？

Iris，一个多元花卉数据集，是最有用的 Pyhton scikit-learn 数据集之一。它分为 3 类，每类 50 个实例，包含三种鸢尾花（山鸢尾、维吉尼亚鸢尾和杂色鸢尾）的萼片和花瓣部分的测量值。除此之外，Iris 数据集包含这三个物种中每个物种的 50 个实例，并由四个特征组成，即 sepal_length (cm)、sepal_width (cm)、petal_length (cm)、petal_width (cm)。

我们可以使用主成分分析（PCA）将 IRIS 数据集转换为具有 2 个特征的新特征空间。

步骤

我们可以按照下面给出的步骤，使用 Python 中的 PCA 将 IRIS 数据集转换为 2 特征数据集 -

第 1 步 - 首先，从 scikit-learn 导入必要的包。我们需要导入数据集和分解包。

步骤 2 - 加载 IRIS 数据集。

步骤 3 - 打印有关数据集的详细信息。

步骤 4 - 初始化主成分分析 (PCA) 并应用 fit() 函数来拟合数据。 p>

步骤 5 - 将数据集转换为新维度，即 2 特征数据集。

示例

在下面的示例中，我们将使用上述步骤通过 PCA 将 scikit-learn IRIS 植物数据集转换为 2 个特征。

# Importing the necessary packages
from sklearn import datasets
from sklearn import decomposition

# Load iris plant dataset
iris = datasets.load_iris()

# Print details about the dataset
print('Features names : '+str(iris.feature_names))
print('\n')
print('Features size : '+str(iris.data.shape))
print('\n')
print('Target names : '+str(iris.target_names))
print('\n')
X_iris, Y_iris = iris.data, iris.target

# Initialize PCA and fit the data
pca_2 = decomposition.PCA(n_components=2)
pca_2.fit(X_iris)

# Transforming iris data to new dimensions(with 2 features)
X_iris_pca2 = pca_2.transform(X_iris)

# Printing new dataset
print('New Dataset size after transformations: ', X_iris_pca2.shape)

登录后复制

输出

它将产生以下输出 -

Features names : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

Features size : (150, 4)

Target names : ['setosa' 'versicolor' 'virginica']

New Dataset size after transformations: (150, 2)

登录后复制

如何将 Iris 数据集转换为 3 特征数据集？

我们可以使用称为主成分分析（PCA）的统计方法将 Iris 数据集转换为具有 3 个特征的新特征空间。 PCA通过分析原始数据集的特征，基本上将数据线性投影到新的特征空间中。

PCA 背后的主要概念是选择数据的“主要”特征并基于它们构建特征。它将为我们提供新的数据集，该数据集的大小较小，但具有与原始数据集相同的信息。

示例

在下面的示例中，我们将使用 PCA 转换 scikit-learn Iris 植物数据集（用 3 个组件初始化）。

# Importing the necessary packages
from sklearn import datasets
from sklearn import decomposition

# Load iris plant dataset
iris = datasets.load_iris()

# Print details about the dataset
print('Features names : '+str(iris.feature_names))
print('\n')
print('Features size : '+str(iris.data.shape))
print('\n')
print('Target names : '+str(iris.target_names))
print('\n')
print('Target size : '+str(iris.target.shape))
X_iris, Y_iris = iris.data, iris.target

# Initialize PCA and fit the data
pca_3 = decomposition.PCA(n_components=3)
pca_3.fit(X_iris)

# Transforming iris data to new dimensions(with 2 features)
X_iris_pca3 = pca_3.transform(X_iris)

# Printing new dataset
print('New Dataset size after transformations : ', X_iris_pca3.shape)
print('\n')

# Getting the direction of maximum variance in data
print("Components : ", pca_3.components_)
print('\n')

# Getting the amount of variance explained by each component
print("Explained Variance:",pca_3.explained_variance_)
print('\n')

# Getting the percentage of variance explained by each component
print("Explained Variance Ratio:",pca_3.explained_variance_ratio_)
print('\n')

# Getting the singular values for each component
print("Singular Values :",pca_3.singular_values_)
print('\n')

# Getting estimated noise covariance
print("Noise Variance :",pca_3.noise_variance_)

登录后复制

输出

它将产生以下输出 -

Features names : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

Features size : (150, 4)

Target names : ['setosa' 'versicolor' 'virginica']

Target size : (150,)
New Dataset size after transformations : (150, 3)

Components : [[ 0.36138659 -0.08452251 0.85667061 0.3582892 ]
[ 0.65658877 0.73016143 -0.17337266 -0.07548102]
[-0.58202985 0.59791083 0.07623608 0.54583143]]

Explained Variance: [4.22824171 0.24267075 0.0782095 ]

Explained Variance Ratio: [0.92461872 0.05306648 0.01710261]

Singular Values : [25.09996044 6.01314738 3.41368064]

Noise Variance : 0.02383509297344944

登录后复制

以上是如何在Python中将Scikit-learn的IRIS数据集转换为只有两个特征的数据集？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7499

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

USDT ERC20转换为TRC20的简易指南 Jan 18, 2024 pm 06:09 PM

我们逐步教您如何将USDTERC20转换为TRC20网络。这是因为许多人喜欢将USDT稳定币从以太坊网络转移到Tron网络，以节省交易费用。因此，如果您想将您的ERC-20代币转换为TRC-20，相信本教程会对您有所帮助。ERC-20和TRC-20的区别ERC-20代币和TRC-20代币分别代表基于以太坊网络和Tron网络的代币。这两个网络之间存在一些差异，主要表现在以下方面：首先，以太坊网络常常面临拥塞和高昂的汽油费问题，这可能导致交易延迟和高昂的交易成本。相比之下，Tron网络则相对拥塞较少

全角英文字母转换为半角形式的实用技巧 Mar 26, 2024 am 09:54 AM

全角英文字母转换为半角形式的实用技巧在现代生活中，我们经常会接触到英文字母，在使用电脑、手机等设备时也经常需要输入英文字母。然而，有时候我们会遇到全角英文字母的情况，而我们需要使用的是半角形式。那么，如何将全角英文字母转换为半角形式呢？下面就为大家介绍一些实用的技巧。首先，全角英文字母和数字是指在输入法中占据一个全角位置的字符，而半角英文字母和数字则是占据一

如何在Windows 11/10中将ODT转换为Word？ Feb 20, 2024 pm 12:21 PM

在这篇文章中，我们将向您展示如何将OpenDocumentTextDocument(ODT)文件转换为MicrosoftWord(Docx、DOC等)。格式。如何在Windows11/10中将ODT转换为Word以下是您可以在WindowsPC上将ODT文档转换为DOC或DOCX格式的方法：使用写字板或Word将ODT转换为Word我们要向您展示的第一种方法是使用写字板或MicrosoftWord将ODT转换为Word。以下是实现这一点的步骤：首先，使用“开始”菜单打开写字板应用程序。现在，转到

如何将AI文件转换为CDR格式 Feb 19, 2024 pm 04:09 PM

AI文件指的是AdobeIllustrator（简称AI）软件创建的矢量图形文件，而CDR文件指的是CorelDRAW软件创建的矢量图形文件。由于这两个软件属于不同的厂商开发，因此它们的文件格式不同，无法直接相互转换。然而，我们可以通过一些方法将AI文件转换为CDR文件。下面将介绍一种常用的转换方法。步骤一：导出AI文件为EPS格式AdobeIllust

Golang时间处理：如何在Golang中将时间戳转换为字符串 Feb 24, 2024 pm 10:42 PM

Golang时间转换：如何将时间戳转换为字符串在Golang中，时间操作是非常常见的操作之一。有时候我们需要将时间戳转换为字符串，以便于展示或者存储。本文将介绍如何使用Golang将时间戳转换为字符串，并提供具体的代码示例。1.时间戳和字符串的转换在Golang中，时间戳通常是以整型数字的形式表示的，表示的是从1970年1月1日至当前时间的秒数。而字符串则

如何将虚拟机转换为物理机？ Feb 19, 2024 am 11:40 AM

将虚拟机器(VM)转换为物理机器是一种将虚拟实例和关联的应用软件迁移到物理硬件平台的过程。这种转换有助于优化操作系统的性能和硬件资源利用。本文旨在深入探讨如何进行这种转换。如何实现从虚拟机到物理机的迁移？通常，虚拟机与物理机之间的转换过程由第三方软件在虚拟机外部执行。这个过程包括多个阶段，涉及虚拟机的配置和资源转移。准备物理机器：第一步是确保物理机满足Windows的硬件要求。我们需要在物理机上备份数据，因为转换过程将覆盖现有数据。*管理员帐户的用户名和密码，具有创建系统映像的管理员权限。将虚拟

PHP 月份转换为英文月份的实现方法详解 Mar 21, 2024 pm 06:45 PM

这篇文章将详细介绍如何将PHP中的月份转换为英文月份的方法，同时给出具体的代码示例。在PHP开发中，有时候我们需要将数字表示的月份转换为英文的月份，这在一些日期处理或数据展示的场景下非常实用。下面将从实现原理、具体代码示例和注意事项等方面进行详解。一、实现原理在PHP中，可以通过使用DateTime类和format方法来实现将数字月份转换为英文月份。Date

qq音乐怎么转换mp3格式手机上qq音乐转mp3格式 Mar 21, 2024 pm 01:21 PM

　　qq音乐让大家尽情享受观影解闷，每天都可以使用这个软件，轻松满足自己的使用，优质海量的歌曲，任由大家畅听，也可以下载保存起来，下次听的时候，不需要网络，而在这里下载的歌曲不是MP3格式的，无法在其他平台使用，会员歌曲过期后也没有办法再听了，所以很多小伙伴们，都想要将歌曲转换成MP3格式的，在这里小编为你们提供方法，帮助大家都可以使用起来！　　1、打开电脑qq音乐，点击右上角【主菜单】按钮，点击【音频转码】，选择【添加歌曲】选项，添加需要转换的歌曲;　　2、添加歌曲完毕，点击选择转换为【mp3

See all articles

如何在Python中将Scikit-learn的IRIS数据集转换为只有两个特征的数据集？

步骤

示例

输出

如何将 Iris 数据集转换为 3 特征数据集？

示例

输出

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题