目录
一、整体框架
二、应用场景评估(决策问题)
三、典型的因果算法
四、因果推断实际落地中的难点
五、案例-京东科技的额度决策模型
六、未来发展
首页 科技周边 人工智能 划重点!!因果推断两大算法框架解析

划重点!!因果推断两大算法框架解析

Jun 04, 2024 pm 04:45 PM
算法 因果推断 知识地图

一、整体框架

划重点!!因果推断两大算法框架解析

主要任务可分为三类。首先是因果结构的发现,即从数据中识别出变量之间的因果关系。其次是因果效应的估计,即从数据中推断一个变量对另一个变量的影响程度。需要注意的是,这种影响并非指相对性,而是指在对一个变量进行干预时,另一个变量的数值或分布如何变化。最后是校正偏差,因为在许多任务中,各种因素可能导致开发样本和应用样本的分布不同。在这种情况下,因果推断可能有助于我们进行校正偏差。

这些功能适用于多种场景,其中最典型的是决策场景。通过因果推断,可以了解不同用户对我们的决策行为的反应。其次,在工业场景中,业务流程通常复杂且长,导致数据存在偏差。通过因果推断清晰描述这些偏差的因果关系,可以帮助我们进行纠偏。此外,许多场景对模型的鲁棒性和解释性要求很高。希望模型能够基于因果关系进行预测,因果推断可以帮助构建更为强大的解释性模型。最后,决策结果的效果评估也很重要。通过因果推断可以帮助更好地分析策略的实际效果。

接下来将介绍因果推断中的两个重要问题:如何判断一个场景是否适合应用因果推断,以及因果推断中的典型算法。 首先,判断一个场景是否适合应用因果推断是十分关键的。因果推断通常用于解决因果关系的问题,即通过观察到的数据来推断出原因和结果之间的关系。因此,在判断一个

二、应用场景评估(决策问题)

划重点!!因果推断两大算法框架解析

首先介绍应用场景评估,判断一个场景是否适合使用推断主要涉及决策问题。

关于一个决策问题,首先需要明确其是什么,即在什么约束条件下做出什么动作,以达到最大化什么样的目标。接着需要考虑这个动作对目标和约束是否产生影响,以及是否需要使用因果推断模型进行预测。 举例来说,在营销产品时,我们通常会考虑在给定总预算的情况下,决定是否给每个用户发放优惠券或打折。以最大化销售额作为总目标进行考虑。如果没有预算约束,可能会影响最终的销售额,但只要知道其是正向策略,就可以给所有用户打折。 这种情况下,虽然决策动作对目标有影响,但无需使用因果推断模型进行预测。

以上是对决策问题的基本分析,此外还需观察数据条目是否满足。对于构建因果模型,不同的因果算法对数据和任务的假设有不同的要求。

  • 潜在结果类的模型有三个关键的假设。首先,个体的因果效应必须是稳定的,例如在探究发优惠券对用户购买概率的影响时,要保证一个用户的行为不受其他用户的影响,比如在线下比价或者受到不同折扣版本的优惠券影响。第二个假设是,在给定的特征情况下,用户的实际处理和潜在结果是独立的,这个假设可以用来处理观测不到的混杂。第三个假设是关于 overlap 的,即任何一种用户都应该给出不同的决策,否则就无法观察到这种用户在不同决策下的表现。
  • 结构因果类的模型所面临的主要假设是变量之间的因果关系,这些假设往往难以证明。而使用 Meta learning 和基于树的方法时,其假设通常是条件独立的,即在给定特征的情况下,决策动作和潜在结果是独立的。这个假设与前面提到的独立性假设相似。

在实际业务场景中,了解先验知识至关重要。首先,需要理解实际观测数据的分配机制,即先前决策的基础。当无法获得最准确的数据时,可能需要依靠一些假设来进行推断。其次,业务经验可以指导我们确定哪些变量对于区分因果效应具有显著影响,这对于进行特征工程至关重要。因此,在处理实际业务时,结合观测数据的分配机制和业务经验,能够更好地应对挑战,有效地进行决策和特征工程。

三、典型的因果算法

划重点!!因果推断两大算法框架解析

第二个重要议题是因果推断算法的选用。

首先是因果结构发现类算法。这些算法的核心目标是确定变量之间的因果关系。主要的研究思路主要可分为三类。第一类方法是根据因果图中的节点网络条件独立性特点进行判断。另一类方法是定义一个评分函数来衡量因果图的质量。例如,通过定义似然函数,寻求使得该函数最大化的有向无环图,并将其作为因果图。第三类方法则是引入了更多的信息。例如,假设两个变量的实际数据生成过程遵循 a n m 型,即加性噪音模型,然后再求解这两个变量之间的因果关系方向。

因果效应的估计涉及多种算法,下面介绍几种常见的算法:

  • 首先是计量经济学中常提及的工具变量法、did 方法和合成控制法。工具变量法的核心思想在于寻找与处理相关但与随机误差项无关的变量,即工具变量。此时工具变量与因变量之间的关系不受混杂的影响,可以将预测分为两个阶段:首先利用工具变量预测处理变量,然后利用预测的处理变量来预测因变量,得到的回归系数即为平均处理效应(ATE)。而 DID 方法和合成控制法则是针对面板数据而设计的方法,但在此不作详细介绍。
  • 另一种常见的方法是利用倾向得分来估计因果效应。这种方法的核心是预测隐藏的分配机制,例如发放优惠券与不发放优惠券的概率。如果两个用户具有相同的优惠券发放概率,但实际上一个用户收到了优惠券,另一个用户没有,那么我们可以认为这两个用户在分配机制上是等价的,因此可以比较它们的效果。基于这一点,可以推广出一系列方法,包括匹配方法、分层方法和加权方法等。
  • 还有一种方法是直接预测结果。即存在观测不到的混杂情况下,也可以通过假设直接预测结果,并通过模型自动进行调整。然而,这种方法可能引发一个问题:如果直接预测结果就足够,那么问题就不存在了吗?实际上,并非如此。
  • 第四是结合倾向得分和潜在结果的思路,使用双重稳健和双重机器学习的方法可能会更准确。双重稳健和双重机器学习将两种方法结合在一起,其中任何一个部分的准确性都可以确保最终结果的可靠性,从而提供了双重保障。
  • 另一种方法是结构因果类的模型,基于因果关系构建模型,如因果图或结构化方程。这种方法允许直接干预某个变量以获得结果,并进行反事实推断。然而,这种方法的前提是我们已经了解变量之间的因果关系,这往往是一个奢侈的假设。
  • Meta learning 方法是一种重要的学习方法,其涵盖了多种不同的类别。其中之一是 S-learning,该方法将处理方法视为一个特征,直接输入模型中。通过调整这个特征,我们可以观察到不同处理方法下结果的变化。这种方法有时被称为单模型学习者,因为我们为实验组和对照组各建立了一个模型,然后通过修改特征来观察结果。另一种方法是 X-learning,其过程类似于 S-learning,但额外考虑了交叉验证的步骤,以更准确地评估模型的性能。
  • 树形方法是一种直观且简单的方法,通过构建树状结构来分裂样本,使得左右节点上的因果效应差异最大化。然而,这种方法容易过拟合,因此在实践中常常采用随机森林等方法来减少过拟合的风险。使用 boosting 方法可能会增加挑战,因为它更容易过滤掉一些信息,所以在使用时需要设计更复杂的模型以防止信息丢失。Meta learning 方法和基于树的算法通常也被称为 Uplift model。
  • 因果表征是近年来在学术界取得一定成果的领域之一。该方法致力于解耦不同模块,将影响因素分开,以更精确地识别混淆因素。通过分析影响因变量y 和处理变量(treatment)的因素,可以识别出可能影响 y 和 treatment 的混淆因素,这些因素被称为混淆因素。这种方法有望提高模型的端到端学习效果。以倾向得分为例,它常常在处理混淆因素时表现出色。然而,倾向得分的过分准确有时并非有利。在同一倾向得分下,可能出现无法满足重叠假设的情况,这是因为倾向得分可能包含一些与混淆因素相关但不影响y 的信息。当模型学习得过于准确时,在加权匹配或分层处理时,可能会导致较大的误差。这些误差实际上并非由混淆因素引起,因此并不需要考虑。因果表征学习方法提供了解决这一问题的途径,能够更有效地处理因果关系的识别和分析。

四、因果推断实际落地中的难点

划重点!!因果推断两大算法框架解析

因果推断在实际应用中面临着诸多挑战。

  • 因果关系的弱化。在许多场景中,因果关系往往与随机波动的噪音处于同一量级,这给建模工作带来了巨大的挑战。在这种情况下,建模的收益相对较低,因为因果关系本身并不明显。然而,即使必须进行建模,也需要采用具有更强学习能力的模型才能够准确捕捉到这种弱化的因果关系。同时,需要特别注意过拟合的问题,因为学习能力较强的模型可能会更容易受到噪音的影响,导致模型过度拟合数据。
  • 第二个普遍存在的问题是数据条件的不足。这个问题的范围较为广泛,主要原因在于我们所使用的算法假设存在着许多不足之处,特别是在利用观测数据进行建模时,我们的假设可能并不完全成立。其中最典型的问题包括重叠假设可能无法满足,我们的分配机制可能缺乏随机性。更为严重的问题是,我们甚至没有足够的随机测试数据,这使得我们难以客观地评估模型的表现。在这种情况下,如果仍然坚持进行建模,而且模型性能优于同比规则,那么我们可以借助一些业务经验来评估模型的决策是否合理。从业务角度出发,对于一些假设不成立的情况,比如未观测到的混杂因素,从理论上并没有特别好的解决方法,但如果一定要使用模型,可以尝试根据业务经验或进行一些小规模的随机测试来评估混杂因素的影响方向和程度。同时,将这些因素考虑到模型中,对于不满足重叠假设的情况,虽然这在我们后面的列举中作为第四个问题,但在此一并讨论,我们可以通过一些算法来排除一些分配机制中的非混杂因素,即通过因果表示学习来缓解这一问题。
  • 在处理这种复杂性时,决策动作显得尤为重要。许多现有模型主要专注于解决二元问题,然而,若涉及多个处理方案,如何分配资源便成为一个更为复杂的问题。针对这一挑战,我们可以将多个处理方案分解成不同领域的子问题。此外,利用深度学习方法,我们可以将处理方案视为特征,并假设连续处理方案与结果之间存在某种函数关系。通过优化这些函数的参数,可以更好地解决连续决策问题,然而,这也引入了一些额外的假设,如重叠问题。
  • 分配机制固定。见上述分析。
  • 另一个常见问题是目标预测很多。在某些情况下,目标预测受到多种因素的影响,而这些因素又与处理方案相关联。为了解决这一问题,我们可以采用多任务学习的方法,尽管直接处理复杂的角色问题可能较为困难,但我们可以通过简化问题,仅预测受处理方案影响最为关键的指标,逐步为决策提供参考。
  • 最后,一些场景下进行随机测试的成本较高,而且效果回收周期较长。在模型上线之前,充分评估模型的效果变得尤为重要。在这种情况下,进行小规模的随机测试可以用来评估效果。尽管评估模型所需的样本集比建模样本集少得多,但如果甚至无法进行小规模的随机测试,那么我们可能只能通过业务解释性来判断模型决策结果的合理性。

五、案例-京东科技的额度决策模型

划重点!!因果推断两大算法框架解析

接下来以京东科技利用因果推断技术制定信贷产品的辅助应用为例,展示如何根据用户特征和经营目标确定最佳信贷额度。在确定经营目标后,这些目标通常可以细分为用户表现的指标,如用户的产品使用情况和借款行为。通过分析这些指标,可以计算出利润、规模等经营目标。因此,额度决策过程分为两步:首先利用因果推断技术预测用户在不同额度下的表现,然后根据这些表现和经营目标,采用各种方法来确定每个用户的最佳信贷额度。

六、未来发展

划重点!!因果推断两大算法框架解析

未来的发展中将面对一系列挑战与机遇。

首先,针对当前因果模型存在的不足之处,学界普遍认为需要大规模的模型来处理更为复杂的非线性关系。因果模型通常只处理二维数据,并且大多数模型结构相对简单,因此未来的研究方向可能包括解决这一问题。

其次,研究者提出了因果表示学习的概念,强调了解耦和模块化思想在表示学习中的重要性。通过从因果关系的角度理解数据生成过程,基于真实世界规律构建的模型很可能具有更好的迁移能力和泛化性。

最后,研究者指出当前的假设过于强大,很多情况下难以满足实际需求,因此需要针对不同情境采用不同的模型。这也导致了模型落地的门槛相当高。因此,寻找通用性强的万金油算法具有巨大的价值。

以上是划重点!!因果推断两大算法框架解析的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能 CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能 Mar 26, 2024 pm 12:41 PM

写在前面&笔者的个人理解目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后,才能让自动驾驶系统中的下游规控模块做出及时、正确的判断和行为决策。目前,具备自动驾驶功能的汽车中通常会配备包括环视相机传感器、激光雷达传感器以及毫米波雷达传感器在内的多种数据信息传感器来收集不同模态的信息,用于实现准确的感知任务。基于纯视觉的BEV感知算法因其较低的硬件成本和易于部署的特点,以及其输出结果能便捷地应用于各种下游任务,因此受到工业

使用C++实现机器学习算法:常见挑战及解决方案 使用C++实现机器学习算法:常见挑战及解决方案 Jun 03, 2024 pm 01:25 PM

C++中机器学习算法面临的常见挑战包括内存管理、多线程、性能优化和可维护性。解决方案包括使用智能指针、现代线程库、SIMD指令和第三方库,并遵循代码风格指南和使用自动化工具。实践案例展示了如何利用Eigen库实现线性回归算法,有效地管理内存和使用高性能矩阵操作。

探究C++sort函数的底层原理与算法选择 探究C++sort函数的底层原理与算法选择 Apr 02, 2024 pm 05:36 PM

C++sort函数底层采用归并排序,其复杂度为O(nlogn),并提供不同的排序算法选择,包括快速排序、堆排序和稳定排序。

人工智能可以预测犯罪吗?探索CrimeGPT的能力 人工智能可以预测犯罪吗?探索CrimeGPT的能力 Mar 22, 2024 pm 10:10 PM

人工智能(AI)与执法领域的融合为犯罪预防和侦查开辟了新的可能性。人工智能的预测能力被广泛应用于CrimeGPT(犯罪预测技术)等系统,用于预测犯罪活动。本文探讨了人工智能在犯罪预测领域的潜力、目前的应用情况、所面临的挑战以及相关技术可能带来的道德影响。人工智能和犯罪预测:基础知识CrimeGPT利用机器学习算法来分析大量数据集,识别可以预测犯罪可能发生的地点和时间的模式。这些数据集包括历史犯罪统计数据、人口统计信息、经济指标、天气模式等。通过识别人类分析师可能忽视的趋势,人工智能可以为执法机构

改进的检测算法:用于高分辨率光学遥感图像目标检测 改进的检测算法:用于高分辨率光学遥感图像目标检测 Jun 06, 2024 pm 12:33 PM

01前景概要目前,难以在检测效率和检测结果之间取得适当的平衡。我们就研究出了一种用于高分辨率光学遥感图像中目标检测的增强YOLOv5算法,利用多层特征金字塔、多检测头策略和混合注意力模块来提高光学遥感图像的目标检测网络的效果。根据SIMD数据集,新算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在检测结果和速度之间实现了更好的平衡。02背景&动机随着远感技术的快速发展,高分辨率光学远感图像已被用于描述地球表面的许多物体,包括飞机、汽车、建筑物等。目标检测在远感图像的解释中

九章云极DataCanvas多模态大模型平台的实践和思考 九章云极DataCanvas多模态大模型平台的实践和思考 Oct 20, 2023 am 08:45 AM

一、多模态大模型的历史发展上图这张照片是1956年在美国达特茅斯学院召开的第一届人工智能workshop,这次会议也被认为拉开了人工智能的序幕,与会者主要是符号逻辑学届的前驱(除了前排中间的神经生物学家PeterMilner)。然而这套符号逻辑学理论在随后的很长一段时间内都无法实现,甚至到80年代90年代还迎来了第一次AI寒冬期。直到最近大语言模型的落地,我们才发现真正承载这个逻辑思维的是神经网络,神经生物学家PeterMilner的工作激发了后来人工神经网络的发展,也正因为此他被邀请参加了这个

算法在 58 画像平台建设中的应用 算法在 58 画像平台建设中的应用 May 09, 2024 am 09:01 AM

一、58画像平台建设背景首先和大家分享下58画像平台的建设背景。1.传统的画像平台传统的思路已经不够,建设用户画像平台依赖数据仓库建模能力,整合多业务线数据,构建准确的用户画像;还需要数据挖掘,理解用户行为、兴趣和需求,提供算法侧的能力;最后,还需要具备数据平台能力,高效存储、查询和共享用户画像数据,提供画像服务。业务自建画像平台和中台类型画像平台主要区别在于,业务自建画像平台服务单条业务线,按需定制;中台平台服务多条业务线,建模复杂,提供更为通用的能力。2.58中台画像建设的背景58的用户画像

实时加SOTA一飞冲天!FastOcc:推理更快、部署友好Occ算法来啦! 实时加SOTA一飞冲天!FastOcc:推理更快、部署友好Occ算法来啦! Mar 14, 2024 pm 11:50 PM

写在前面&笔者的个人理解在自动驾驶系统当中,感知任务是整个自驾系统中至关重要的组成部分。感知任务的主要目标是使自动驾驶车辆能够理解和感知周围的环境元素,如行驶在路上的车辆、路旁的行人、行驶过程中遇到的障碍物、路上的交通标志等,从而帮助下游模块做出正确合理的决策和行为。在一辆具备自动驾驶功能的车辆中,通常会配备不同类型的信息采集传感器,如环视相机传感器、激光雷达传感器以及毫米波雷达传感器等等,从而确保自动驾驶车辆能够准确感知和理解周围环境要素,使自动驾驶车辆在自主行驶的过程中能够做出正确的决断。目

See all articles