目錄
一、整體架構
#二、應用場景評估(決策問題)
三、典型的因果演算法
#四、因果推論實際落點中的難點
#五、個案-京東科技的額度決策模式
六、未來發展
首頁 科技週邊 人工智慧 劃重點! !因果推斷兩大演算法框架解析

劃重點! !因果推斷兩大演算法框架解析

Jun 04, 2024 pm 04:45 PM
演算法 因果推斷 知識地圖

一、整體架構

劃重點! !因果推斷兩大演算法框架解析

#主要任務可分為三類。首先是因果結構的發現,即從資料中辨識出變數之間的因果關係。其次是因果效應的估計,即從資料推斷一個變數對另一個變數的影響程度。需要注意的是,這種影響並非指相對性,而是指在對一個變數進行幹預時,另一個變數的數值或分佈如何變化。最後是校正偏差,因為在許多任務中,各種因素可能導致開發樣本和應用樣本的分佈不同。在這種情況下,因果推論可能有助於我們進行校正偏差。

這些功能適用於多種場景,其中最典型的是決策場景。透過因果推斷,可以了解不同使用者對我們的決策行為的反應。其次,在工業場景中,業務流程通常複雜且長,導致數據偏差。透過因果推論清晰描述這些偏差的因果關係,可以幫助我們進行糾偏。此外,許多場景對模型的穩健性和解釋性要求很高。希望模型能夠基於因果關係進行預測,因果推論可以幫助建立更強大的解釋性模型。最後,決策結果的效果評估也很重要。透過因果推論可以幫助更好地分析策略的實際效果。

接下來將介紹因果推論中的兩個重要問題:如何判斷一個場景是否適合應用因果推斷,以及因果推論中的典型演算法。 首先,判斷一個場景是否適合應用因果推論是十分關鍵的。因果推論通常用於解決因果關係的問題,即透過觀察到的數據來推斷出原因和結果之間的關係。因此,在判斷一個

#二、應用場景評估(決策問題)

劃重點! !因果推斷兩大演算法框架解析

#首先介紹應用場景評估,判斷一個場景是否適合使用推論主要涉及決策問題。

關於一個決策問題,首先需要先明確其是什麼,即在什麼約束條件下做出什麼動作,以達到最大化什麼樣的目標。接著需要考慮這個動作對目標和限制是否產生影響,以及是否需要使用因果推論模型來預測。 舉例來說,在行銷產品時,我們通常會考慮在給定總預算的情況下,決定是否給每個用戶發放優惠券或折扣。以最大化銷售額作為總目標進行考慮。如果沒有預算約束,可能會影響最終的銷售額,但只要知道其是正向策略,就可以給所有用戶打折。 在這種情況下,雖然決策動作對目標有影響,但無需使用因果推論模型進行預測。

以上是決策問題的基本分析,此外還需觀察資料條目是否滿足。對於建構因果模型,不同的因果演算法對資料和任務的假設有不同的要求。

  • 潛在結果類別的模型有三個關鍵的假設。首先,個體的因果效應必須是穩定的,例如在探究發優惠券對用戶購買機率的影響時,要確保一個用戶的行為不受其他用戶的影響,例如在線下比價或受到不同折扣版本的優惠券影響。第二個假設是,在給定的特徵情況下,使用者的實際處理和潛在結果是獨立的,這個假設可以用來處理觀測不到的混雜。第三個假設是關於 overlap 的,也就是任何一種使用者都應該給予不同的決策,否則就無法觀察到這種使用者在不同決策下的表現。
  • 結構因果類別的模型所面臨的主要假設是變數之間的因果關係,這些假設往往難以證明。而使用 Meta learning 和基於樹的方法時,其假設通常是條件獨立的,即在給定特徵的情況下,決策動作和潛在結果是獨立的。這個假設與前面提到的獨立性假設相似。

在實際業務場景中,了解先驗知識至關重要。首先,需要先理解實際觀測資料的分配機制,也就是先前決策的基礎。當無法獲得最準確的數據時,可能需要依靠一些假設來進行推論。其次,業務經驗可以指導我們確定哪些變數對於區分因果效應具有顯著影響,這對於進行特徵工程至關重要。因此,在處理實際業務時,結合觀測資料的分配機制和業務經驗,能夠更好地應對挑戰,有效地進行決策和特徵工程。

三、典型的因果演算法

劃重點! !因果推斷兩大演算法框架解析

第二個重要議題是因果推論演算法的選用。

首先是因果結構發現類別演算法。這些演算法的核心目標是確定變數之間的因果關係。主要的研究思路主要可分為三類。第一類方法是根據因果圖中的節點網路條件獨立性特性進行判斷。另一類方法是定義一個評分函數來衡量因果圖的品質。例如,透過定義似然函數,尋求使得該函數最大化的有向無環圖,並將其作為因果圖。第三類方法則是引入了更多的資訊。例如,假設兩個變數的實際資料產生過程遵循 a n m 型,即加性雜訊模型,然後再求解這兩個變數之間的因果關係方向。

因果效應的估計值涉及多種演算法,以下介紹幾種常見的演算法:

#
  • 首先是計量經濟學常被提及的工具變數法、did 法和合成控制法。工具變量法的核心思想在於尋找與處理相關但與隨機誤差項無關的變量,即工具變量。此時工具變量與因變量之間的關係不受混雜的影響,可以將預測分為兩個階段:首先利用工具變量預測處理變量,然後利用預測的處理變量來預測因變量,得到的回歸係數即為平均處理效應(ATE)。而 DID 方法和合成控制法則是針對面板資料而設計的方法,但在此不作詳細介紹。
  • 另一種常見的方法是利用傾向分數來估計因果效果。這種方法的核心是預測隱藏的分配機制,例如發放優惠券與不發放優惠券的機率。如果兩個用戶具有相同的優惠券發放機率,但實際上一個用戶收到了優惠券,另一個用戶沒有,那麼我們可以認為這兩個用戶在分配機制上是等價的,因此可以比較它們的效果。基於這一點,可以推廣出一系列方法,包括匹配方法、分層方法和加權方法等。
  • 還有一個方法是直接預測結果。即存在觀測不到的混雜情況下,也可以透過假設直接預測結果,並透過模型自動進行調整。然而,這種方法可能引發一個問題:如果直接預測結果就足夠,那麼問題就不存在了嗎?實際上,並非如此。
  • 第四是結合傾向分數和潛在結果的思路,使用雙重穩健和雙重機器學習的方法可能會更準確。雙重穩健和雙重機器學習將兩種方法結合在一起,其中任何一個部分的準確性都可以確保最終結果的可靠性,從而提供了雙重保障。
  • 另一種方法是結構因果類別的模型,基於因果關係建構模型,如因果圖或結構化方程式。這種方法允許直接幹預某個變數以獲得結果,並進行反事實推論。然而,這種方法的前提是我們已經了解變數之間的因果關係,這往往是一個奢侈的假設。
  • Meta learning 方法是一種重要的學習方法,其涵蓋了多種不同的類別。其中之一是 S-learning,該方法將處理方法視為一個特徵,直接輸入模型中。透過調整這個特徵,我們可以觀察到不同處理方法下結果的變化。這種方法有時被稱為單一模型學習者,因為我們為實驗組和對照組各建立了一個模型,然後透過修改特徵來觀察結果。另一種方法是 X-learning,其流程類似於 S-learning,但額外考慮了交叉驗證的步驟,以更準確地評估模型的性能。
  • 樹狀法是一種直覺且簡單的方法,透過建構樹狀結構來分裂樣本,使得左右節點上的因果效應差異最大化。然而,這種方法容易過度擬合,因此在實務上常常採用隨機森林等方法來減少過度擬合的風險。使用 boosting 方法可能會增加挑戰,因為它更容易過濾掉一些訊息,所以在使用時需要設計更複雜的模型以防止資訊遺失。 Meta learning 方法和基於樹的演算法通常也被稱為 Uplift model。
  • 因果表徵是近年來在學術界取得一定成果的領域之一。此方法致力於解耦不同模組,將影響因素分開,以更精確地識別混淆因素。透過分析影響因變數y 和處理變數(treatment)的因素,可以辨識出可能影響 y 和 treatment 的混淆因素,這些因素稱為混淆因素。這種方法有望提高模型的端到端學習效果。以傾向分數為例,它常常在處理混淆因素時表現優異。然而,傾向得分的過度準確有時並非有利。在同一傾向分數下,可能出現無法滿足重疊假設的情況,這是因為傾向分數可能包含一些與混淆因素相關但不影響y 的資訊。當模型學習過於準確時,在加權匹配或分層處理時,可能會導致較大的誤差。這些誤差其實並非由混淆因素所引起,因此並不需要考慮。因果表徵學習方法提供了解決這個問題的途徑,能夠更有效地處理因果關係的識別和分析。

#四、因果推論實際落點中的難點

劃重點! !因果推斷兩大演算法框架解析

因果推論在實際應用上面臨諸多挑戰。

  • 因果關係的弱化。在許多場景中,因果關係往往與隨機波動的噪音處於同一量級,這給建模工作帶來了巨大的挑戰。在這種情況下,建模的收益相對較低,因為因果關係本身並不明顯。然而,即使必須進行建模,也需要採用具有更強學習能力的模型才能夠準確地捕捉到這種弱化的因果關係。同時,需要特別注意過擬合的問題,因為學習能力較強的模型可能會更容易受到雜訊的影響,導致模型過度擬合資料。
  • 第二個普遍存在的問題是資料條件的不足。這個問題的範圍較為廣泛,主要原因在於我們所使用的演算法假設存在許多不足之處,特別是在利用觀測資料進行建模時,我們的假設可能並不完全成立。其中最典型的問題包括重疊假設可能無法滿足,我們的分配機制可能缺乏隨機性。更嚴重的問題是,我們甚至沒有足夠的隨機測試數據,這使得我們難以客觀地評估模型的表現。在這種情況下,如果仍然堅持進行建模,而且模型效能優於同比規則,那麼我們可以藉助一些業務經驗來評估模型的決策是否合理。從業務角度出發,對於一些假設不成立的情況,例如未觀測到的混雜因素,從理論上並沒有特別好的解決方法,但如果一定要使用模型,可以嘗試根據業務經驗或進行一些小規模的隨機測試來評估混雜因素的影響方向和程度。同時,將這些因素考慮到模型中,對於不滿足重疊假設的情況,雖然這在我們後面的列舉中作為第四個問題,但在此一併討論,我們可以通過一些算法來排除一些分配機制中的非混雜因素,即透過因果表示學習來緩解此問題。
  • 在處理這種複雜性時,決策動作顯得格外重要。許多現有模型主要專注於解決二元問題,然而,若涉及多個處理方案,如何分配資源便成為一個更為複雜的問題。針對這項挑戰,我們可以將多個處理方案分解成不同領域的子問題。此外,利用深度學習方法,我們可以將處理方案視為特徵,並假設連續處理方案與結果之間存在某種函數關係。透過優化這些函數的參數,可以更好地解決連續決策問題,然而,這也引入了一些額外的假設,例如重疊問題。
  • 分配機制固定。見上述分析。
  • 另一個常見問題是目標預測很多。在某些情況下,目標預測受到多種因素的影響,而這些因素又與處理方案相關聯。為了解決這個問題,我們可以採用多任務學習的方法,儘管直接處理複雜的角色問題可能較為困難,但我們可以透過簡化問題,僅預測受處理方案影響最為關鍵的指標,逐步為決策提供參考。
  • 最後,在某些場景下進行隨機測試的成本較高,效果回收週期較長。在模型上線之前,充分評估模型的效果變得特別重要。在這種情況下,進行小規模的隨機測試可以用來評估效果。儘管評估模型所需的樣本集比建模樣本集少得多,但如果甚至無法進行小規模的隨機測試,那麼我們可能只能透過業務解釋性來判斷模型決策結果的合理性。

#五、個案-京東科技的額度決策模式

劃重點! !因果推斷兩大演算法框架解析

接下來以京東科技利用因果推論技術制定信貸產品的輔助應用為例,展示如何根據使用者特徵和經營目標確定最佳信貸額度。在確定經營目標後,這些目標通常可以細分為使用者表現的指標,如使用者的產品使用情況和借款行為。透過分析這些指標,可以計算出利潤、規模等經營目標。因此,額度決策過程分為兩個步驟:首先利用因果推論技術預測使用者在不同額度下的表現,然後根據這些表現和經營目標,採用各種方法來確定每個使用者的最佳信用額度。

#

六、未來發展

劃重點! !因果推斷兩大演算法框架解析

在未來的發展中將面對一系列挑戰與機會。

首先,針對當前因果模型存在的不足之處,學界普遍認為需要大規模的模型來處理更複雜的非線性關係。因果模型通常只處理二維數據,大多數模型結構相對簡單,因此未來的研究方向可能包括解決這個問題。

其次,研究者提出了因果表示學習的概念,強調了解耦和模組化思想在表示學習中的重要性。透過從因果關係的角度來理解資料生成過程,基於真實世界規律建構的模型很可能具有更好的遷移能力和泛化性。

最後,研究者指出當前的假設過於強大,許多情況下難以滿足實際需求,因此需要針對不同情境採用不同的模型。這也導致了模型落地的門檻相當高。因此,尋找通用性強的萬金油演算法具有巨大的價值。

以上是劃重點! !因果推斷兩大演算法框架解析的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1668
14
CakePHP 教程
1426
52
Laravel 教程
1328
25
PHP教程
1273
29
C# 教程
1255
24
CLIP-BEVFormer:明確監督BEVFormer結構,提升長尾偵測性能 CLIP-BEVFormer:明確監督BEVFormer結構,提升長尾偵測性能 Mar 26, 2024 pm 12:41 PM

寫在前面&amp;筆者的個人理解目前,在整個自動駕駛系統當中,感知模組扮演了其中至關重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後,才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息,用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結果能便捷地應用於各種下游任務,因此受到工業

使用C++實現機器學習演算法:常見挑戰及解決方案 使用C++實現機器學習演算法:常見挑戰及解決方案 Jun 03, 2024 pm 01:25 PM

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

探究C++sort函數的底層原理與演算法選擇 探究C++sort函數的底層原理與演算法選擇 Apr 02, 2024 pm 05:36 PM

C++sort函數底層採用歸併排序,其複雜度為O(nlogn),並提供不同的排序演算法選擇,包括快速排序、堆排序和穩定排序。

人工智慧可以預測犯罪嗎?探索CrimeGPT的能力 人工智慧可以預測犯罪嗎?探索CrimeGPT的能力 Mar 22, 2024 pm 10:10 PM

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統,用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測:基礎知識CrimeGPT利用機器學習演算法來分析大量資料集,識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢,人工智慧可以為執法機構

改進的檢測演算法:用於高解析度光學遙感影像目標檢測 改進的檢測演算法:用於高解析度光學遙感影像目標檢測 Jun 06, 2024 pm 12:33 PM

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

九章雲極DataCanvas多模態大模型平台的實踐與思考 九章雲極DataCanvas多模態大模型平台的實踐與思考 Oct 20, 2023 am 08:45 AM

一、多模態大模型的歷史發展上圖這張照片是1956年在美國達特茅斯學院舉行的第一屆人工智慧workshop,這次會議也被認為拉開了人工智慧的序幕,與會者主要是符號邏輯學屆的前驅(除了前排中間的神經生物學家PeterMilner)。然而這套符號邏輯學理論在隨後的很長一段時間內都無法實現,甚至到80年代90年代還迎來了第一次AI寒冬期。直到最近大語言模型的落地,我們才發現真正承載這個邏輯思維的是神經網絡,神經生物學家PeterMilner的工作激發了後來人工神經網絡的發展,也正因為此他被邀請參加了這個

演算法在 58 畫像平台建置中的應用 演算法在 58 畫像平台建置中的應用 May 09, 2024 am 09:01 AM

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

即時加SOTA一飛沖天! FastOcc:推理更快、部署友善Occ演算法來啦! 即時加SOTA一飛沖天! FastOcc:推理更快、部署友善Occ演算法來啦! Mar 14, 2024 pm 11:50 PM

寫在前面&筆者的個人理解在自動駕駛系統當中,感知任務是整個自駕系統中至關重要的組成部分。感知任務的主要目標是使自動駕駛車輛能夠理解和感知周圍的環境元素,如行駛在路上的車輛、路旁的行人、行駛過程中遇到的障礙物、路上的交通標誌等,從而幫助下游模組做出正確合理的決策和行為。在一輛具備自動駕駛功能的車輛中,通常會配備不同類型的信息採集感測器,如環視相機感測器、雷射雷達感測器以及毫米波雷達感測器等等,從而確保自動駕駛車輛能夠準確感知和理解周圍環境要素,使自動駕駛車輛在自主行駛的過程中能夠做出正確的決斷。目

See all articles