什么是机器学习中的铰链损失？-人工智能-PHP中文网

什么是机器学习中的铰链损失？

Lisa Kudrow

发布： 2025-03-14 10:38:09

原创

428 人浏览过

铰链损失：分类任务中的关键要素，尤其是在支持向量机（SVM）中。它通过惩罚附近或跨越决策边界的人来量化预测错误。这种强调类之间的稳健边距可以改善模型的概括。本指南深入研究了铰链损失基本面，其数学基础以及适用于新手和经验丰富的机器学习从业人员的实际应用。

什么是机器学习中的铰链损失？

了解机器学习的损失
损失功能的关键方面
铰链损失解释了
铰链损失的操作机制
利用铰链损失的优势
铰链损失的缺点
Python实施示例
概括
常见问题

了解机器学习的损失

在机器学习中，损耗函数衡量模型的预测与实际目标值之间的差异。它量化了错误，指导模型的训练过程。最小化损失函数是模型训练期间的主要目标。

损失功能的关键方面

目的：损失功能指导训练期间的优化过程，使模型能够通过惩罚不准确的预测来学习最佳权重。
损失与成本：损失是指单个数据点的错误，而成本代表整个数据集的平均损失（通常与“目标函数”互换使用）。
类型：损失功能因任务而异：
- 回归：平均误差（MSE），平均绝对误差（MAE）。
- 分类：横向渗透损失，铰链损失，Kullback-Leibler Divergence。

铰链损失解释了

铰链损耗是主要用于分类的损失函数，尤其是在SVM中。它评估了模型预测与真实标签的一致性，不仅有利于正确的预测，而且有利于通过边缘分离的预测。

铰链损失惩罚了：

错误分类。
正确分类，但离决策边界太近（在边距内）。

此保证金创建增强了分类器的鲁棒性。

公式

单个数据点的铰链损失是：

什么是机器学习中的铰链损失？

在哪里：

Y ：实际标签（SVM的1或-1）。
F（x） ：预测得分（阈值之前的模型输出）。
最大（0，...） ：确保非负损失。

铰链损失的操作机制

正确且自信（y·f（x）≥1）：无损失（l（y，f（x））= 0）。
正确但不自信（0 损失与边缘距离成正比。
不正确（y·f（x）≤0）：损失随误差幅度线性增加。

什么是机器学习中的铰链损失？

利用铰链损失的优势

边缘最大化：对于SVM至关重要，导致更好的概括和对过度拟合的抵抗力。
二进制分类：对具有线性分类器的二进制任务非常有效。
稀疏梯度：提高计算效率。
理论基础：基于利润的分类中的强大理论支持。
异常鲁棒性：降低正确分类的异常值的影响。
线性和非线性模型：适用于线性和基于内核的SVM。

铰链损失的缺点

仅二进制分类：直接适用于二进制分类；多级问题所需的扩展。
非差异性：在y·f（x）= 1处的非差异性，需要次级方法。
对不平衡数据的敏感性：可能会偏向不平衡的类别分布。
非稳态输出：不提供概率输出。
嘈杂的数据较低：对边界附近的错误分类点更敏感。
有限的神经网络支持：与跨凝性相比，在神经网络中较不常见。
可伸缩性挑战：对于大型数据集而言，计算上的昂贵，尤其是对于内核SVM。

Python实施示例

来自Sklearn.svm导入线性
从sklearn.datasets导入make_classification
来自sklearn.model_selection导入train_test_split
来自sklearn.metrics导入精度，classification_report，confusion_matrix
导入numpy作为NP

＃...（原始输入中提供的代码）...

登录后复制

什么是机器学习中的铰链损失？