目錄
一、因果推論的研究典範" >一、因果推論的研究典範
#、從隨機資料到觀測資料" >#、從隨機資料到觀測資料
2、因果關係表示學習" >2、因果關係表示學習
三、反事實額度模型Mono-CFR" >三、反事實額度模型Mono-CFR
如何離線評估額度的風險的估計曲線? " >如何離線評估額度的風險的估計曲線?
首頁 科技週邊 人工智慧 基於反事實因果推論的度小滿額度模型

基於反事實因果推論的度小滿額度模型

Jun 03, 2023 pm 10:16 PM
因果推斷 度小滿

基於反事實因果推論的度小滿額度模型

一、因果推論的研究典範

#研究典範目前主要有兩個主要的研究方向:

  • Judea Pearl Structure Model 
  • 潛在的輸出框架 

基於反事實因果推論的度小滿額度模型

#在Judea Pearl 《The Book of Why – The New Science of Cause and Effect》這本書中,將認知階梯定位為三層:

  • #第一層-關聯:透過關聯的方式找出規律,可以直接觀察;
  • 第二層-幹預:如果改變現狀,應實施什麼樣的行動,得出什麼樣的結論,可以透過實驗觀察;
  • 第三層-反事實:由於法律法規等問題無法直接實驗觀察,透過反事實假設,如果實施了行動,會發生什麼,如何評估ATE和CATE,是較為困難的問題。

基於反事實因果推論的度小滿額度模型

首先闡述下產生相關關係的四種方式:

1. 因果關聯:原因和結果之間有可靠的,可追溯的,能夠正向依賴的關係,例如煙霧與煙霧警報器具有因果關聯;

#2. 混淆關聯:含有未能直接觀測的混淆變量,例如身高和閱讀能力是否能夠關聯起來,需要控制年齡這個變數相似,從而得出有效的結論;

3. 選擇偏差:本質上是伯克森悖論,例如探究外表和才華的關係,如果只在明星群體中觀察,可能會得出結論:外表和才華不可兼得。如果在全部人類裡觀察,外表與才華沒有因果關係。

4. 逆向因果關係:即因果倒置,例如統計顯示人類結婚時間越長,壽命就越長。但反過來,我們不能說:如果想獲得更長的壽命,就要提早結婚。

混淆因子如何影響觀測結果,這裡有兩個case可以說明:

基於反事實因果推論的度小滿額度模型

上面圖片描述了運動量與膽固醇水平的關係。從左圖可得出結論:運動量越大,膽固醇水平越高。但加入年齡分層來看,相同年齡分層下,運動量越大,膽固醇越低。此外,隨著年齡增長,膽固醇水平逐漸升高,這個結論才符合我們的認知。

基於反事實因果推論的度小滿額度模型

#

第二個例子為信用場景。從歷史統計資料可以看出,給定的額度(能藉到的錢款數)越高,逾期率越低。但金融領域,會先根據借款人的A卡判斷其信用資質,如果信用資質越好,則平台賦予額度越高,整體逾期率也很低。但根據局部隨機實驗表明,相同信用資質人群,會有一部分人其額度風險遷移曲線變化比較緩慢,也會有一部分人其額度遷移風險較高,即額度提升後,帶來的風險增量較大。

上面兩個case說明,如果建模中忽略混淆因子,可能會得到錯誤,甚至相反的結論。

基於反事實因果推論的度小滿額度模型

如何從RCT隨機樣本過渡到觀測樣本因果建模?

對於RCT樣本的情況,如果希望評估ATE指標,可以透過分組相減或DID(difference in difference)。如果希望評估CATE指標,可以透過uplift 建模。常見的方法例如有meta-learner,double machine learning,causal forest等等。這裡要注意必要的三大假設:SUTVA,Unconfoundedness和Positivity。最核心的假設為:不存在未觀測混淆因子。

對於僅有觀測樣本的情況,無法直接取得treatment->outcome的因果關係,我們需要藉助必要的手段切斷covariates到treatment的後門路徑。常見方法是工具變數法和反事實表示學習。工具變數法需要對具體業務抽絲剝繭,繪製業務變數中因果圖。反事實表示學習則依賴成熟的機器學習,配對covariates相似的樣本做因果評估。

二、、因果推論的框架演進

#、從隨機資料到觀測資料

接下來介紹因果推論的框架演進,是如何一步步過度到因果表示學習的。

常見Uplift Model有:Slearner, Tlearner, Xlearner。

其中Slearner將介入變數視為一維特徵。需要注意,在常見的樹模型裡,treatment容易被淹沒,導致treatment effect估計偏小。

基於反事實因果推論的度小滿額度模型

Tlearner將treatment離散化,對介入變數分組建模,每一個treatment建立預測模型,再作差。需要注意,較少的樣本量會帶來較高的估計變異數。

基於反事實因果推論的度小滿額度模型

Xlearner分組交叉建模,將實驗組和對照組分別進行交叉運算訓練。此方法綜合了S/T-learner的優點,其缺點是引入了更高的模型結構誤差,提高了調參難度。

基於反事實因果推論的度小滿額度模型

三種model比較:

基於反事實因果推論的度小滿額度模型

在上圖中,橫軸是複雜的因果效應,MSE的的估計誤差,縱軸是簡單的因果效應,橫軸縱軸分別表示兩份數據。綠色表示Slearner的誤差分佈,褐色表示Tlearner的誤差分佈,藍色表示Xlearner的誤差分佈。

#

在隨機樣本條件下,Xlearner對於複雜的因果效應估計和簡單的因果效應估計均更優;Slearner對於複雜因果效應預估表現相對較差,對簡單因果效應估計更優;Tlearner則與Slearner相反。

基於反事實因果推論的度小滿額度模型

#如果有隨機樣本,X到T的箭頭可以去掉。過渡到觀測建模後X到T的箭頭去不掉,treatment和outcome會同時受到confounders的影響,這時可以進行一些消偏處理。例如DML(Double Machine Learning)的方式,進行兩階段建模。在第一階段中,這裡的X是使用者本身的表徵特徵,例如年齡、性別等。混淆變數會包含例如歷史中篩選特定人群的操作。在第二階段中,對上一階段計算結果的誤差進行建模,這裡的即是對CATE的估計。

從隨機資料到觀測資料有三種處理方式:

(1)做隨機試驗,但業務成本較高;

(2)尋找工具變量,一般比較困難;

(3)假設觀測到所有的混淆因子,利用DML、表示學習等方法來配對相似樣本。

2、因果關係表示學習

基於反事實因果推論的度小滿額度模型

反事實學習的核心思想就是平衡不同treatment下的特徵分佈。

核心問題有兩個:

1. 如何調整訓練樣本的權重? 

2. 如何在表示空間中,讓轉換後的樣本在實驗組和對照組分佈更平衡?

本質思想是在變換映射後,為每個樣本尋找它的反事實「雙胞胎」。映射之後treatment組和control組X的分佈比較相似。

基於反事實因果推論的度小滿額度模型

比較有代表性的工作是發表在TKDE 2022上面的論文,介紹了DeR-CFR的一些工作,這部分其實是DR-CRF模型的迭代,採用model-free的方式分離觀測變數。

將X變數分成三塊:調節變數A,工具變數I和混淆變數C。之後再透過I,C,A來調節不同treatment下X的權重,達到在觀測資料上進行因果建模的目的。

這種方法的優點是可以分離混淆因子,減少估計偏差。缺點是難以處理連續型介入。

這個網路的核心就是如何分離A/I/C三類變數。調節變數A只與Y有關,需要確保A與T正交,且A對Y的經驗誤差較小;工具變數I只與T有關,需要滿足I與Y關於T條件獨立,且I對T的經驗誤差較小;混淆變數C與T和Y都相關,w是網路的權重,給了網路權重後,需要保證C與T關於w條件獨立。這裡的正交性可以透過一般的距離公式來實現,例如logloss或mse歐氏距離等限制。

基於反事實因果推論的度小滿額度模型


#

如何處理連續型乾預,這塊也是有一些新的論文研究,發表在ICLR2021上的VCNet,提供了連續型乾預的估計方法。缺點是難以直接應用在觀測資料上(CFR場景)。

將X映射到Z上,Z主要包含先前提到的X分解中的I變數和C變量,即將對treatment比較有貢獻的變數從X中提取出來了。這裡將連續treatment分成B個分段/預測頭,每個連續函數轉換成分段的線性函數,最下化經驗誤差log-loss,用來學習

基於反事實因果推論的度小滿額度模型

之後再用學完的Z和θ(t)去學習。

基於反事實因果推論的度小滿額度模型

即outcome。這裡的θ(t)是可以處理連續型treatment的關鍵,是一個變係數的模型,但是這個模型只處理了連續性treatment,如果是觀測數據,無法保證每一個B分段數據同質。

三、反事實額度模型Mono-CFR

最後來介紹一下度小滿的反事實額度模型,這裡主要解決的是觀測資料上對連續型Treatment的反事實估計問題。

基於反事實因果推論的度小滿額度模型

核心問題是,如何給使用者設計(可藉)額度,使得平台獲利最大化?這裡的先驗知識是,額度越高,用戶借款越多,違約風險越高。反之同理。 

  • 第一步,定義獲利公式。獲利=額度收入-額度風險。公式看起來簡單,但實際上會有很多細節的調整。這樣,問題就轉化為了在觀測資料上建模額度與風險(壞帳)、額度與收入的因果關係。 
  • 第二步,估計使用者在各個額度檔位上的預估收入和壞賬,確定最大獲利額度。

我們期望對每個使用者有如上圖所示的一個獲利曲線,在不同的額度檔位上,對收益值做反事實預估。

基於反事實因果推論的度小滿額度模型

如果在觀測資料上看到額度越高風險越低,本質上是由於混淆因子的存在。我們場景裡的混淆因子是信用資質。信用資質比較好的人,平台會賦予更高的額度,反之則賦予較低額度。優信用資質族群的絕對風險仍舊明顯低於低信用資質族群。若拉齊信用資質,會看到額度的提升將帶來風險的提升,高額度突破了使用者自身的償債能力。

基於反事實因果推論的度小滿額度模型

我們開始介紹反事實額度模型的架構。在可觀測變數X中,存在先前提到的三種變量,其中大多數是混淆變數C,小部分是策略未考慮到的是調節變數A,還有一部分是僅跟介入有關係的工具變數I 。 

  • 工具變數I:如政策、需求等,會影響歷史的定額策略,但不會影響逾期機率。 
  • 混淆變數C:如信用、收入與負債等,同時影響對額度的調整,與這個人的逾期機率。 
  • 調節變項A:如環境、社會地位等,會影響逾期率。

模型想法:給定期望額度μ(T|X),學習∆T與Y的單調性關係(Dose-Response Curve) 。期望額度可以理解為模型學習到的連續性傾向額度,使得混淆變數C和額度T之間的關係能夠斷開,轉換成∆T與Y的因果關係學習,從而對∆T下Y的分佈進行較好的刻畫。

基於反事實因果推論的度小滿額度模型


#這裡進一步精進上述抽象的框架:將∆T轉換成變係數模型,再接入IntegrandNN網絡,訓練誤差分成兩部分:

基於反事實因果推論的度小滿額度模型


這裡的α是衡量風險重要性的超參數。

Mono-CFR由兩大部分組成: 

  • ##額度傾向網路:預測策略傾向額度,使X​​⊥∆T。

作用一:蒸餾出X中與T最相關的變量,最小化經驗誤差。 

作用二:錨定歷史策略上的近似樣本。

  • 風險單調網絡:約束∆T與Y的理論單調關係。 

作用一:對弱係數變數施加獨立單調限制。

作用二:減少估計偏差。

問題轉換為: 

  • 額度傾向網路:驗證輸出∆ T與Y 的關係。 
  • 風險單調網路:如何約束∆T與Y的單調性?

實際額度傾向網路輸入如下:

基於反事實因果推論的度小滿額度模型

##橫軸是A卡分數定義出的人群,可以看出,不同傾向額度μ(T|X)下,額度差∆T與逾期率Y呈現單調遞增關係,越劣質人群的額度差∆T變化曲線越陡峭,實際逾期率變化曲線也越陡峭,整個曲線斜率更大。這裡的結論完全是透過歷史的數據學習得出的。

基於反事實因果推論的度小滿額度模型

#從X與∆T分佈圖中可以看出:不同資質人群(圖中透過不同顏色區分)的額度差∆T均勻分佈在相似的區間之中,這是從實際角度說明。 #

基於反事實因果推論的度小滿額度模型

從理論角度,亦可嚴格證明。

第二部分是風險單調網路的實作:

基於反事實因果推論的度小滿額度模型

這裡的ELU 1函數數學運算式為:

基於反事實因果推論的度小滿額度模型

基於反事實因果推論的度小滿額度模型

∆T和逾期率呈現單調遞增的變化趨勢,透過ELU 1函數的導數總是大於等於0來保證。

接下來說明風險單調網路如何對弱係數變數學的更準確:

#假設有這樣一個公式:

基於反事實因果推論的度小滿額度模型

#可以看出這裡的x1即為弱係數變量,當對x1施加單調性約束後,對響應Y的估計更加準確。如果沒有這樣的單獨約束,x1的重要性會被x2淹沒,導致模型偏差增加。

基於反事實因果推論的度小滿額度模型

如何離線評估額度的風險的估計曲線?

分成兩部分:

  • 第一部分:可解釋驗證

基於反事實因果推論的度小滿額度模型

##不同資質人群下,去繪製如上圖所示的額度風險變化曲線,模型可以學出不同資質族群(圖中不同顏色標識)不同檔位實際額度與逾期率的區分度。

  • 第二部分:利用小流量實驗驗證,不同提額幅度下的風險偏差,可以透過uplift分箱來得出。

線上實驗結論: 

在額度上漲30%條件下,用戶逾期金額下降20%以上, 借款提升30%,獲利性提升30%以上。

未來模型預期:

#以model-free形式將工具變數與調節變數更清晰地分開,使模型在劣質人群上的風險遷移表現更佳。

在實際業務場景中,度小滿的模型演進迭代流程如下:

基於反事實因果推論的度小滿額度模型

第一步,觀測建模,不斷捲動歷史觀測數據,去做反事實因果學習,不斷拉新訓練窗口,補充外部資料來源。

第二步,模型迭代,依據小流量隨機樣本進行效果驗證,支援有效的模型迭代。

第三步,業務決策,業務根據模型輸出進行實驗決策,驗證模型效果提升,拿到業務效益。

#

以上是基於反事實因果推論的度小滿額度模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

因果推論主要技術思想與方法總結 因果推論主要技術思想與方法總結 Apr 12, 2023 am 08:10 AM

導讀:因果推論是資料科學的一個重要分支,在互聯網和工業界的產品迭代、演算法和激勵策略的評估中都扮演者重要的角色,結合資料、實驗或統計計量模型來計算新的改變帶來的收益,是決策的基礎。然而,因果推論並不是一件簡單的事。首先,在日常生活中,人們常常把相關和因果混為一談。相關往往代表兩個變數具有同時成長或降低的趨勢,但是因果意味著我們想要知道對一個變數施加改變的時候會發生什麼樣的結果,或者說我們期望得到反事實的結果,如果過去做了不一樣的動作,未來是否會改變?然而困難在於,反事實的數據往往是

基於反事實因果推論的度小滿額度模型 基於反事實因果推論的度小滿額度模型 Jun 03, 2023 pm 10:16 PM

一、因果推論的研究典範研究典範目前主要有兩個主要的研究方向:JudeaPearlStructureModel潛在的輸出架構在JudeaPearl《TheBookofWhy–TheNewScienceofCauseandEffect》這本書中,將認知階梯定位為三層:第一層-關聯:透過關聯的方式找出規律,可以直接觀察;第二層-幹預:如果改變現狀,應實施什麼樣的行動,得出什麼樣的結論,可以透過實驗觀察;第三層-反事實:由於法律法規等問題無法直接實驗觀察,透過反事實假設,如果實施了行動,會發生什麼,如

劃重點! !因果推斷兩大演算法框架解析 劃重點! !因果推斷兩大演算法框架解析 Jun 04, 2024 pm 04:45 PM

一、整體框架主要任務可分為三類。首先是因果結構的發現,即從資料中辨識出變數之間的因果關係。其次是因果效應的估計,即從資料推斷一個變數對另一個變數的影響程度。需要注意的是,這種影響並非指相對性,而是指在對一個變數進行幹預時,另一個變數的數值或分佈如何變化。最後是校正偏差,因為在許多任務中,各種因素可能導致開發樣本和應用樣本的分佈不同。在這種情況下,因果推論可能有助於我們進行校正偏差。這些功能適用於多種場景,其中最典型的是決策場景。透過因果推斷,可以了解不同使用者對我們的決策行為的反應。其次,在工業

基於因果推論的推薦系統:回顧與前瞻 基於因果推論的推薦系統:回顧與前瞻 Apr 12, 2024 am 09:01 AM

本次分享的主題為基於因果推論的推薦系統,回顧過去的相關工作,並提出本方向的未來展望。為什麼在推薦系統中需要使用因果推論技術?現有的研究工作用因果推論來解決三類問題(參見Gaoetal.的TOIS2023論文CausalInferenceinRecommenderSystems:ASurveyandFutureDirections):首先,在推薦系統中存在各種各樣的偏差(BIAS),因果推斷是一種有效去除這些偏差的工具。為了解決資料稀缺性和無法準確估計因果效應的問題,推薦系統可能面臨挑戰。為了解決

因果推薦技術在行銷和可解釋性上的應用 因果推薦技術在行銷和可解釋性上的應用 May 18, 2023 pm 01:58 PM

一、Uplifit增益敏感度預測關於Uplift增益,通用的業務問題可以總結為,在圈定的人群中,行銷人員會想知道,新的行銷動作T=1相比較原始的行銷動作T=0,能帶來多少的平均收益(lift,ATE,AverageTreatmentEffect)。大家會關注新的行銷動作是否比原來的更有效。在保險場景下,行銷動作主要指的是保險的推薦,例如推薦模組上透出的文案和產品,目標是在各種行銷動作和約束條件限制下,找到因行銷動作而增益最多的群體,去做定向投放(AudienceTargeting)。先做一個比較

快手短影片推薦中的因果推斷實踐 快手短影片推薦中的因果推斷實踐 Feb 05, 2024 pm 06:20 PM

一、快手單列短視頻推薦場景1、關於快手*數據取自於2023年二季度快手是一款備受歡迎的短視頻和直播社區應用,其在今年第二季度取得了令人矚目的MAU和DAU新紀錄。快手的核心理念是透過觀察和分享普通人的生活,讓每個人都能成為內容的創造者和傳播者。在快手的應用中,短視頻場景主要分為單列和雙列兩種形式。目前,單列的流量較大,用戶可以透過上下滑動的方式沉浸式地瀏覽影片內容。而雙列的呈現形式類似於資訊流,使用者需要從螢幕上出現的幾個內容中選擇感興趣的進行點擊觀看。推薦演算法是快手業務生態的核心,對於流量分發

如何在因果推論中更好地利用數據? 如何在因果推論中更好地利用數據? Apr 11, 2023 pm 07:43 PM

導讀:本次分享題目為《如何在因果推論中更好地利用數據? 》,主要介紹團隊近期在因果上已發表論文的相關工作。本報告從兩個方面來介紹我們如何利用更多的數據來做好因果推斷,一個是利用歷史對照數據來明確緩解混淆偏差,另一個是多源數據融合下的因果推斷。全文目錄:因果推論背景糾偏因果樹GBCT因果資料融合在螞蟻的業務應用一、因果推斷背景常見的機器學習預測問題一般設置在同樣的系統裡面,如通常會假設獨立同分佈,比如預測吸煙的人中得肺癌的機率、圖片分類等預測問題。而因果的問題則關心的是數據背後的機制,常見的問題如

AI詐騙成功率100%?度小滿防深偽模型'用魔法打敗魔法” AI詐騙成功率100%?度小滿防深偽模型'用魔法打敗魔法” May 30, 2023 pm 09:46 PM

2023-05-2610:22:19作者:宋均益日前,一條#AI詐騙成功率接近100%#的話題衝上微博熱搜。一個AI換臉的影片,讓福建某科技公司的法人代表在10分鐘內就被騙走了430萬。國外也發生了一起AI相關詐騙,一封附上谷歌CEO視頻的郵件,讓不少YouTube博客們下載了帶著危險病毒的文件。這兩起詐騙事件都有著深度偽造技術deepfake的身影。這是一項誕生了6年之久的換臉大法,如今AIGC技術的大爆發,更使得製作難以識別的deepfake視頻越來越容易。對人臉辨識應用普遍的金融業來說,

See all articles