利用模型性能管理(MPM)解决机器学习模型监控挑战
译者 | 李睿
审校 | 孙淑娟
在过去几年,世界的数字化给组织和企业带来了独特的机遇和挑战。虽然数据的蓬勃发展为提高决策准确度提供了更多的机会,但现在分析和利用这些信息更加耗时和昂贵。因此,各种规模的企业都在部署机器学习(ML)模型,这些模型可以处理大量数据,并识别经常被分析师忽视或耗费不合理时间的模式和相关性。这些模型具有增强决策和推动卓越业务结果的能力。例如,一些机器学习模型可以对特定产品在下一年的销售速度做出高度准确的预测,以改进营销和库存计划。其他企业能够识别可能导致数百万美元收入损失的欺诈交易。
但随着对机器学习模型的日益依赖,对模型性能的监控和对人工智能建立信任的需求也变得更加迫切。如果没有对机器学习模型监控,MLOps和数据科学团队会面临以下问题:
- 模型性能不一致。这可能会发生波动,因为机器学习模型是根据历史数据训练的,这些数据可能与它们在生产中看到的真实数据不同。
- 缺乏控制和可调试性。因为复杂的机器学习系统是不透明的,从业者可能不太了解机器学习模型,不知道在出现问题时如何修复它。
- 偏见实例。机器学习模型可能放大它们所训练的数据中的隐藏偏见,使企业面临法律和声誉风险,并可能给消费者带来有害的结果。
- 提高机器学习的性能。因为很难理解和跟踪需要进行哪些改进,所以在初始发布之后,机器学习模型不会获得更多的投资。
MLOps团队也更有可能对他们的模型缺乏信心,这可能导致在项目上花费更多的时间和更多的错误。机器学习模型监视使开发人员能够在试验和生产过程中调试模型,以便在问题发生时捕获它们。这是获得可解释、公平和合乎道德的人工智能解决方案的最有效方式,这在当今世界是至关重要的。假设一家银行正在使用机器学习系统来批准贷款,他们可能收到客户投诉,询问银行为什么某笔贷款被拒绝,而这家银行需要负责解释模型做出这个决定的原因。如果没有适当的监控解决方案,追踪这一问题的答案几乎是不可能的。
无论机器学习模型是负责预测欺诈、批准贷款还是定位广告,发生的微小变化都可能导致模型漂移、报告不准确或存在偏见——所有这些都会导致收入损失和影响品牌信誉。
当今模型监视面临的挑战
不幸的是,由于当今组织所依赖的机器学习模型种类繁多,数量众多,因此机器学习模型监视变得更加复杂。机器学习模型现在服务于广泛的用例,例如反洗钱、工作匹配、临床诊断和监视行星。它们也有许多不同的表现形式(表格、时间序列、文本、图像、视频和音频)。虽然这些模型可以处理企业需要使用的大量数据,但跟踪它们的难度和成本要高得多。
一些企业已经部署了传统的基础设施监控解决方案,旨在支持广泛的运营可见性,以克服这些挑战。其他人则尝试在内部创建自己的工具。在任何一种情况下,这些解决方案通常都不能满足机器学习系统的独特需求。与传统软件系统不同,机器学习系统的性能是不确定的,这取决于各种因素,例如季节性、新的用户行为趋势,以及通常极高维的上游数据系统。例如,功能完美的广告模式可能需要在新的假期到来时进行更新。类似地,经过训练的一个机器学习模型显示在美国的内容推荐可能不会很好地用于国际用户注册。或者,企业经常面临无法扩展的问题,由于型号过时,浪费了生产故障排除时间,以及内部工具维护的额外费用。
为了在机器学习模型中启用可见性和可解释性,并克服常见的模型监视挑战,企业需要能够方便地监视、解释、分析和改进机器学习模型的解决方案,并采用模型性能管理(MPM)。
模型性能管理(MPM)如何解决性能和偏见
模型性能管理(MPM)是位于机器学习工作流中心的一个集中控制系统,它跟踪模型生命周期所有阶段的性能,并关闭机器学习反馈循环。采用模型性能管理(MPM),企业可以通过解释和根本原因分析来发现深刻的可操作的见解,同时立即显示机器学习性能问题,以避免负面的业务影响。
模型性能管理(MPM)不断自动重新评估模型业务价值和性能,发布生产中模型性能的警报,并帮助开发人员在出现偏见的第一个迹象时主动响应。因为模型性能管理(MPM)跟踪模型从训练到发布的行为,它也可以解释是什么因素导致了某种预测。将模型监视与机器学习可观察性的其他支柱(如可解释性和模型公平性)结合起来,为机器学习工程师和数据科学家提供了全面的工具包,可以嵌入到他们的机器学习工作流程中,并提供了横跨模型验证和监视用例的单一控制面板。企业从模型性能管理(MPM)中受益,不仅因为它能够提高模型监视的效率,还因为可以减少导致代价高昂的监管罚款或声誉损失的偏见实例。 机器学习模型需要在整个生命周期中持续的模型监视和再训练。模型性能管理(MPM)使开发人员不仅可以在他们的模型中获得信心和更高的效率,而且还可以理解和验证他们的人工智能结果背后的原因和过程。
原文标题:Solving for ML Model Monitoring Challenges with Model Performance Management (MPM) ,作者:Krishnaram Kenthapadi
以上是利用模型性能管理(MPM)解决机器学习模型监控挑战的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

想了解更多AIGC的内容,请访问:51CTOAI.x社区https://www.51cto.com/aigc/译者|晶颜审校|重楼不同于互联网上随处可见的传统问题库,这些问题需要跳出常规思维。大语言模型(LLM)在数据科学、生成式人工智能(GenAI)和人工智能领域越来越重要。这些复杂的算法提升了人类的技能,并在诸多行业中推动了效率和创新性的提升,成为企业保持竞争力的关键。LLM的应用范围非常广泛,它可以用于自然语言处理、文本生成、语音识别和推荐系统等领域。通过学习大量的数据,LLM能够生成文本

机器学习是人工智能的重要分支,它赋予计算机从数据中学习的能力,并能够在无需明确编程的情况下改进自身能力。机器学习在各个领域都有着广泛的应用,从图像识别和自然语言处理到推荐系统和欺诈检测,它正在改变我们的生活方式。机器学习领域存在着多种不同的方法和理论,其中最具影响力的五种方法被称为“机器学习五大派”。这五大派分别为符号派、联结派、进化派、贝叶斯派和类推学派。1.符号学派符号学(Symbolism),又称为符号主义,强调利用符号进行逻辑推理和表达知识。该学派认为学习是一种逆向演绎的过程,通过已有的

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

编辑|KX在药物研发领域,准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此,来自厦门大学的研究人员提出了一种新颖的多模态特征提取(MFE)框架,该框架首次结合了蛋白质表面、3D结构和序列的信息,并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明,该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外,消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「S

本站8月1日消息,SK海力士今天(8月1日)发布博文,宣布将出席8月6日至8日,在美国加利福尼亚州圣克拉拉举行的全球半导体存储器峰会FMS2024,展示诸多新一代产品。未来存储器和存储峰会(FutureMemoryandStorage)简介前身是主要面向NAND供应商的闪存峰会(FlashMemorySummit),在人工智能技术日益受到关注的背景下,今年重新命名为未来存储器和存储峰会(FutureMemoryandStorage),以邀请DRAM和存储供应商等更多参与者。新产品SK海力士去年在
