梯度提升算法决策过程的逐步可视化-人工智能-PHP中文网

梯度提升算法介绍

决策过程可视化

首页

科技周边

人工智能

梯度提升算法决策过程的逐步可视化

王林

Apr 13, 2023 pm 05:52 PM

机器学习梯度提升算法

梯度提升算法是最常用的集成机器学习技术之一，该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础，所以在这篇文章中，我们将从头开始构建一个梯度增强模型并将其可视化。

梯度提升算法介绍

梯度提升算法（Gradient Boosting）是一种集成学习算法，它通过构建多个弱分类器，然后将它们组合成一个强分类器来提高模型的预测准确率。

梯度提升算法的原理可以分为以下几个步骤：

初始化模型：一般来说，我们可以使用一个简单的模型（比如说决策树）作为初始的分类器。
计算损失函数的负梯度：计算出每个样本点在当前模型下的损失函数的负梯度。这相当于是让新的分类器去拟合当前模型下的误差。
训练新的分类器：用这些负梯度作为目标变量，训练一个新的弱分类器。这个弱分类器可以是任意的分类器，比如说决策树、线性模型等。
更新模型：将新的分类器加入到原来的模型中，可以用加权平均或者其他方法将它们组合起来。
重复迭代：重复上述步骤，直到达到预设的迭代次数或者达到预设的准确率。

由于梯度提升算法是一种串行算法，所以它的训练速度可能会比较慢，我们以一个实际的例子来介绍：

假设我们有一个特征集Xi和值Yi，要计算y的最佳估计

我们从y的平均值开始

每一步我们都想让F_m(x)更接近y|x。

在每一步中，我们都想要F_m(x)一个更好的y给定x的近似。

首先，我们定义一个损失函数

梯度提升算法决策过程的逐步可视化

然后，我们向损失函数相对于学习者Fm下降最快的方向前进:

梯度提升算法决策过程的逐步可视化

因为我们不能为每个x计算y，所以不知道这个梯度的确切值，但是对于训练数据中的每一个x_i，梯度完全等于步骤m的残差:r_i!

所以我们可以用弱回归树h_m来近似梯度函数g_m，对残差进行训练:

梯度提升算法决策过程的逐步可视化

然后，我们更新学习器

梯度提升算法决策过程的逐步可视化

这就是梯度提升，我们不是使用损失函数相对于当前学习器的真实梯度g_m来更新当前学习器F_{m}，而是使用弱回归树h_m来更新它。

也就是重复下面的步骤

1、计算残差:

2、将回归树h_m拟合到训练样本及其残差(x_i, r_i)上

3、用步长alpha更新模型

看着很复杂对吧，下面我们可视化一下这个过程就会变得非常清晰了

决策过程可视化

这里我们使用sklearn的moons 数据集，因为这是一个经典的非线性分类数据

import numpy as np
 import sklearn.datasets as ds
 import pandas as pd
 import matplotlib.pyplot as plt
 import matplotlib as mpl
 
 from sklearn import tree
 from itertools import product,islice
 import seaborn as snsmoonDS = ds.make_moons(200, noise = 0.15, random_state=16)
 moon = moonDS[0]
 color = -1*(moonDS[1]*2-1)
 
 df =pd.DataFrame(moon, columns = ['x','y'])
 df['z'] = color
 df['f0'] =df.y.mean()
 df['r0'] = df['z'] - df['f0']
 df.head(10)

登录后复制

让我们可视化数据：

梯度提升算法决策过程的逐步可视化

下图可以看到，该数据集是可以明显的区分出分类的边界的，但是因为他是非线性的，所以使用线性算法进行分类时会遇到很大的困难。

梯度提升算法决策过程的逐步可视化

那么我们先编写一个简单的梯度增强模型:

def makeiteration(i:int):
"""Takes the dataframe ith f_i and r_i and approximated r_i from the features, then computes f_i+1 and r_i+1"""
clf = tree.DecisionTreeRegressor(max_depth=1)
clf.fit(X=df[['x','y']].values, y = df[f'r{i-1}'])
df[f'r{i-1}hat'] = clf.predict(df[['x','y']].values)
 
eta = 0.9
df[f'f{i}'] = df[f'f{i-1}'] + eta*df[f'r{i-1}hat']
df[f'r{i}'] = df['z'] - df[f'f{i}']
rmse = (df[f'r{i}']**2).sum()
clfs.append(clf)
rmses.append(rmse)

登录后复制

上面代码执行3个简单步骤:

将决策树与残差进行拟合:

clf.fit(X=df[['x','y']].values, y = df[f'r{i-1}'])
 df[f'r{i-1}hat'] = clf.predict(df[['x','y']].values)

登录后复制

然后，我们将这个近似的梯度与之前的学习器相加:

df[f'f{i}'] = df[f'f{i-1}'] + eta*df[f'r{i-1}hat']

登录后复制

最后重新计算残差:

df[f'r{i}'] = df['z'] - df[f'f{i}']

登录后复制

步骤就是这样简单，下面我们来一步一步执行这个过程。

第1次决策

Tree Split for 0 and level 1.563690960407257

第2次决策

梯度提升算法决策过程的逐步可视化

Tree Split for 1 and level 0.5143677890300751

梯度提升算法决策过程的逐步可视化

第3次决策

梯度提升算法决策过程的逐步可视化

Tree Split for 0 and level -0.6523728966712952

第4次决策

Tree Split for 0 and level 0.3370491564273834

第5次决策

Tree Split for 0 and level 0.3370491564273834

第6次决策

Tree Split for 1 and level 0.022058885544538498

第7次决策

Tree Split for 0 and level -0.3030575215816498

第8次决策

Tree Split for 0 and level 0.6119407713413239

第9次决策

可以看到通过9次的计算，基本上已经把上面的分类进行了区分

我们这里的学习器都是非常简单的决策树，只沿着一个特征分裂!但整体模型在每次决策后边的越来越复杂，并且整体误差逐渐减小。

plt.plot(rmses)

登录后复制

这也就是上图中我们看到的能够正确区分出了大部分的分类

如果你感兴趣可以使用下面代码自行实验：

https://www.php.cn/link/bfc89c3ee67d881255f8b097c4ed2d67

以上是梯度提升算法决策过程的逐步可视化的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7322

Java教程

1625

CakePHP 教程

1350

Laravel 教程

1262

PHP教程

1209

显示更多

Related knowledge

15个值得推荐的开源免费图像标注工具 Mar 28, 2024 pm 01:21 PM

图像标注是将标签或描述性信息与图像相关联的过程，以赋予图像内容更深层次的含义和解释。这一过程对于机器学习至关重要，它有助于训练视觉模型以更准确地识别图像中的各个元素。通过为图像添加标注，使得计算机能够理解图像背后的语义和上下文，从而提高对图像内容的理解和分析能力。图像标注的应用范围广泛，涵盖了许多领域，如计算机视觉、自然语言处理和图视觉模型具有广泛的应用领域，例如，辅助车辆识别道路上的障碍物，帮助疾病的检测和诊断通过医学图像识别。本文主要推荐一些较好的开源免费的图像标注工具。1.Makesens

一文带您了解SHAP：机器学习的模型解释 Jun 01, 2024 am 10:58 AM

在机器学习和数据科学领域，模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用，理解模型的决策过程变得尤为重要。可解释人工智能（ExplainableAI|XAI）通过提高模型的透明度，帮助建立对机器学习模型的信任和信心。提高模型的透明度可以通过多种复杂模型的广泛应用等方法来实现，以及用于解释模型的决策过程。这些方法包括特征重要性分析、模型预测区间估计、局部可解释性算法等。特征重要性分析可以通过评估模型对输入特征的影响程度来解释模型的决策过程。模型预测区间估计

通透！机器学习各大模型原理的深度剖析！ Apr 12, 2024 pm 05:55 PM

通俗来说，机器学习模型是一种数学函数，它能够将输入数据映射到预测输出。更具体地说，机器学习模型就是一种通过学习训练数据，来调整模型参数，以最小化预测输出与真实标签之间的误差的数学函数。在机器学习中存在多种模型，例如逻辑回归模型、决策树模型、支持向量机模型等，每一种模型都有其适用的数据类型和问题类型。同时，不同模型之间存在着许多共性，或者说有一条隐藏的模型演化的路径。将联结主义的感知机为例，通过增加感知机的隐藏层数量，我们可以将其转化为深度神经网络。而对感知机加入核函数的话就可以转化为SVM。这一

通过学习曲线识别过拟合和欠拟合 Apr 29, 2024 pm 06:50 PM

本文将介绍如何通过学习曲线来有效识别机器学习模型中的过拟合和欠拟合。欠拟合和过拟合1、过拟合如果一个模型对数据进行了过度训练，以至于它从中学习了噪声，那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子，所以它会错误地分类一个看不见的/新的例子。对于一个过拟合的模型，我们会得到一个完美/接近完美的训练集分数和一个糟糕的验证集/测试分数。略有修改："过拟合的原因：用一个复杂的模型来解决一个简单的问题，从数据中提取噪声。因为小数据集作为训练集可能无法代表所有数据的正确表示。"2、欠拟合如

人工智能在太空探索和人居工程中的演变 Apr 29, 2024 pm 03:25 PM

20世纪50年代，人工智能（AI）诞生。当时研究人员发现机器可以执行类似人类的任务，例如思考。后来，在20世纪60年代，美国国防部资助了人工智能，并建立了实验室进行进一步开发。研究人员发现人工智能在许多领域都有用武之地，例如太空探索和极端环境中的生存。太空探索是对宇宙的研究，宇宙涵盖了地球以外的整个宇宙空间。太空被归类为极端环境，因为它的条件与地球不同。要在太空中生存，必须考虑许多因素，并采取预防措施。科学家和研究人员认为，探索太空并了解一切事物的现状有助于理解宇宙的运作方式，并为潜在的环境危机

使用C++实现机器学习算法：常见挑战及解决方案 Jun 03, 2024 pm 01:25 PM

C++中机器学习算法面临的常见挑战包括内存管理、多线程、性能优化和可维护性。解决方案包括使用智能指针、现代线程库、SIMD指令和第三方库，并遵循代码风格指南和使用自动化工具。实践案例展示了如何利用Eigen库实现线性回归算法，有效地管理内存和使用高性能矩阵操作。

可解释性人工智能：解释复杂的AI/ML模型 Jun 03, 2024 pm 10:08 PM

译者|李睿审校|重楼人工智能（AI）和机器学习（ML）模型如今变得越来越复杂，这些模型产生的输出是黑盒——无法向利益相关方解释。可解释性人工智能（XAI）致力于通过让利益相关方理解这些模型的工作方式来解决这一问题，确保他们理解这些模型实际上是如何做出决策的，并确保人工智能系统中的透明度、信任度和问责制来解决这个问题。本文探讨了各种可解释性人工智能（XAI）技术，以阐明它们的基本原理。可解释性人工智能至关重要的几个原因信任度和透明度：为了让人工智能系统被广泛接受和信任，用户需要了解决策是如何做出的