數智商業領域如何因應決策智慧技術的挑戰？三位專家解答-人工智慧-PHP中文網

鄧小鐵教授：計算經濟學的幾個最新研究進展

首頁

科技週邊

人工智慧

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

PHPz

May 06, 2023 pm 10:58 PM

智慧深度學習

近年來，伴隨著廣告主的需求變化和相關技術發展，計算經濟學理論、博弈論和人工智慧技術被越來越多地應用到廣告拍賣機制、投放策略中。

決策智慧在商業場景中的意義逐漸凸顯。用戶看到的每一次商品展現、商家的每一次廣告出價、平台的每一次流量分配，背後都有龐大且複雜的決策智能做支撐。

這些動作的目標在於優化使用者購物體驗，讓廣告投放的決策過程更加智能，同時讓廣告主、媒體在平台實現長期繁榮。廣告主希望在有限的資源投入下最大化行銷效果，平台希望能建立更好的生態。然而流量環境、其他參競廣告形成的競爭環境的複雜性、以及廣告投放策略中出價、目標人群、資源位、投放時間等變數的巨大組合複雜度，使得最優廣告投放策略的計算與執行充滿了挑戰。

這些問題如何解決？效益最大化的目標具體如何分解？這些有關於決策智能的重要議題，也是領域內的研究者和實務工作者最關心的。

為了深入探討「數智商業場景中的決策智能」這個主題，近日，阿里媽媽博見社聯合機器之心，邀請到了北京大學鄧小鐵教授、中科院蔡少偉研究員和阿里媽媽CTO 鄭波老師三位領域內的資深學者和專家，展開了一系列主題分享。

以下為鄧小鐵教授、蔡少偉研究員、鄭波老師的主題分享內容，機器之心在不改變原意的前提下進行了整理。

鄧小鐵教授：計算經濟學的幾個最新研究進展

我今天粗糙地介紹一下計算經濟學，這是一個很有歷史的研究領域，最早可追溯到1930 年。後來的計算經濟學從另一個角度出發，將經濟學變成計算，之前的計算經濟學就是透過計算做經濟學研究，這次講一講其中的思路。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

我們從計算的角度來考慮經濟學，有幾個主要關鍵問題：首先是最佳化，機器學習都是最佳化，從中可以看到很多優化體系。優化之後，還有一個問題叫做均衡，以前我們做計算經濟學是從計劃經濟的思路去做的，但當時也有一派是從世界銀行做發展中國家的發展，他們給發展中國家定計劃，從優化投入產出的思路展開。從計算角度計算均衡會是很困難的問題，所以出現了一個概念，叫做可計算的一般均衡（Computable general equilibrium）。

最近，我們也越來越多可以看到動力學系統，因為這個世界很多東西並不是均衡的狀態，特別突出看到均衡的場景是在數位經濟活動中，其中包括經濟學層面的東西，例如定價。在數位經濟中，每時每秒都可以看到交易數據和價格波動。我們可以清楚楚看得數據的變化，而不是一年過去之後再把經濟數據統計出來。

計算經濟學的整個框架下還有很多東西。每個經濟主體都要優化，它們共同博弈的不動點就是均衡。平台也會博弈均衡這件事情，特別是網路廣告平台，做廣告的人到平台上來，將廣告要透過平台、媒體發放出去。對於媒體，要把廣告位置提供出來，利用自身對某一類人群的吸引力。對於平台，要想的是如何將大家的興趣更匹配。阿里媽媽作為國內最大的廣告平台，同樣面臨博弈均衡的問題，需要安排好各方面利益，以實現社會效益最大化，同時也實現機制設計最大收益。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

我們可以從三個角度來談最佳化。

首先是經濟智能體刻畫的問題。很多機器學習的東西都寫成優化的問題，例如怎麼用機器學習的方法算出來制約的限制條件，包括有些環境中的限制條件。

在非完全資訊下，有很多條件是未知的，原來的經濟學考慮不瞭如此複雜的東西，例如博弈對手的效益函數是什麼、博弈對手的策略空間是什麼、博弈對手都有哪些，非完全訊息也是非常重要的對經濟活動的刻畫。

許多假設可以刻畫非完全訊息，例如經濟人知道對手的效益函數、限制以及其他各種資訊。關於彼此的效益函數有一個 common knowledge：我們知道 distribution。但這個 distribution 怎麼來的呢？這就走進入機器學習範疇：為什麼 player 要告訴彼此、告訴我們它知道什麼？針對這些，在計算角度上就有一些很合理的問題。

賽局動力學，這是計算經濟學的第三步。從實體經濟的經濟學來講，很多活動是經過了 6000 年演化發展過來的，是大家慢慢地博弈，直到均衡。在數位經濟中，想一下子到達均衡會是很大的挑戰。

廣告平台優化是阿里媽媽在做的事情。我們講了這麼多難的運算任務，什麼時候可以做好呢？在單一參數的情況下，已有的理論能夠支撐，但是多參數怎麼做到，理論上還沒有現成的定義。

很重要的一點是，整個經濟學體系已經建好了，但經濟學用到網路中會產生一個很大的缺陷 —— 它是靜態的。大家一定知道，業界的事情不是靜態的，比如說「雙十一」大促會產生很多挑戰，如何設計紅包的價格，根據市場已知模型如何建立這些東西，這些成為了今天計算經濟學重要的挑戰：一是近似求解優化，一是均衡計劃，一是平台競爭動力學。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

近似計算的難度很大，我們最多知道的均衡的解可以算到三分之一，最多是33% 的錯誤率，跟最優相差33%，所以均衡計算確實挺難的。自動設計方法論、隱藏對手模型學習，是這方面的框架，這裡都是跟資訊容量相關的東西。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

另一就是與市場上的未知對手賽局。我們要考慮至少兩個 company，建立一個模型來設計它們之間的博弈，這裡都是單調的，並不知道所有的資訊。根據已知的資訊看市場的波動、價格設計變化，我們基於此設計一個隱函數的最佳化模型，用機器學習方法做分析。

多方認知次序的先後帶給我們賽局的認知層次。近年來，一些研究討論了許多一價拍賣為什麼比二價拍賣好。 Myerson 假設所有人知道所有人的價值分佈，發展了一套最佳拍賣理論，但我們其實不知道公共知識。我們自己的研究是從另一個角度來考慮的，出發點是沒有先驗的共同知識，把原來用的機率方法建立 Myerson 最優拍賣理論的假設放棄掉。

在沒有這套拍賣均衡的基礎假設的環境下，最優解可以如何實現均衡？可以發現，泛化一價拍賣收益是跟 Myerson 相等的。這裡應對買家以最優效益為目標公佈的價值分佈，賣家設計的 Myerson 最優收益，等價於它已泛化一價拍賣的期望拍賣收益。

最終的結論是，Myerson 和 GFP 是等價的，它們要比 VCG 要好，但是在 IID 情況下是相等的，Symmetric BNE 和 GSP 也是等價的。

計算經濟學用到的另一個概念是馬可夫博弈，一種在動態環境下的博弈，特別是無窮輪賽局求解的問題。我們對問題從三個方向進行了處理：一是為計算做了有理化的簡化，把目標限制在近似解；二是用時間折現率保證無窮輪收益的收斂性；三是數學上的分階段求以及將策略不同輪的變化侷限在一輪的變化。如此，無窮求和的難點得以克服。

我們進一步在馬可夫博弈的應用方面簡化了計算的難度。對於共識機制的設計，有清晰的馬可夫獎勵分析，而且講了一個很好的故事。按照機制設計規定，大多數人支持它就是對。但後面發現，大多數支持並不保證經濟學上的安全。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

對於數位經濟設計環節的問題，我們最新的工作是可以用Insightful mining Equilibrium 克服，用遠見的策略實現最優，最後是馬爾科夫博弈的架構，形成了馬爾科夫獎勵過程，增加一個認知層級，從誠實礦池、自私礦池，再越過一個層級，達到遠見礦池的結果。

同樣地，許多網路公司要處理動態的東西而非靜態的東西，如今世界經濟學不再是以前的經濟學，此外還透過數學使得機器學習方法論和博弈論緊密結合在了一起。我們因此克服了只能處理靜態經濟學的情形，演進到了能夠處理動態的情形。

蔡少偉研究員：一種求解大規模稀疏組合最佳化問題的高效方法

大家好，今天我分享的題目是大規模稀疏組合最佳化的高效方法。許多決策問題的核心都涉及組合最佳化問題，人們很關注如何選擇合適的組合方案來達到目標最佳化。

求解組合最佳化主要有兩類方法：一類是啟發式方法，包括啟發式搜尋和啟發式構造，例如大家常用的貪心演算法就可以看作啟發式構造的一種，貪心準則就是啟發式（heuristics）；另外一種是分支限界（brand-and-bound）為代表的精確演算法。

啟發式方法的好處是對規模不敏感，所以可以用近似求解大規模的問題，缺點是往往不知道求出的解離最優解有多大的差距，也可能已經找到最優解了，但你不知道。 Branch And Bound 是完備性的，如果你給它充足時間算到停下來，可以求出最優解並且證明這是最優解。但這個方法是有代價的，而且會對規模比較敏感，因為這類演算法是指數爆炸的，往往不適用於大規模問題。

不管是做搜尋還是做構造，啟發式演算法框架大多很簡單，主要是依賴啟發式怎麼設計，要根據哪個準則去做。分支限界方法主要在於怎麼做「界」，大家看論文也會發現，很多 Branch And Bound 的論文在做 bounding 技術，怎麼把這個界做得更緊，可以更好對解空間進行剪枝。

後來我想，可不可以把這兩個結合一下？也就是說，既能夠保持對規模不敏感，又能把 bounding 技術加進去。大家很容易想到，可以用預處理的方法，或是先做 Heuristics 再做 Branch And Bound，把 Heuristics 結果當作初始解等等。我們在這方面提出了一個新的方法 —— 嵌套地在 Heuristics 和 Branch And Bound 中去迭代。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

簡單來說，這個方法先粗糙地做一個 Heuristic solving，求一個初步結果。一般來說，做 bounding 需要上下界，Heuristics 會粗糙得到一個下界，接下來透過設計上界的函數。假設這個問題規模比較大，包括很多元素，我們可以淘汰一些，讓問題縮小一圈。之後再精緻一點，繼續做 Heuristic solving，這樣可能改進下界。在這個基礎上，演算法可以再做一些 bounding，一直嵌套地做下去。於是這個演算法就變成半精確演算法，有可能可以證明這是最優解的，因為在某一步發現問題空間夠小，不需要 Heuristic solving 而是可以直接精確求解。另外，如果沒有求出最優解，也可以知道最優解的區間在哪裡。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

接下來舉兩個例子來解釋這個方法。

第一個是「最大團問題」。團是圖論裡很經典的概念，在一個圖裡，點和點之間都有邊相連的子圖，就稱為團，最大團問題是找到最大規模的團。如果給它一個加權，對每個頂點賦予一個權重，這樣的最大加權團問題是要找到總權重最大的團。下圖這個例子中，分別是四團、三團，三團的權重更大一些，也就是這個圖的最大加權團。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

按照這個框架來做這個事情，我們需要兩個子演算法，一個做啟發式求解，在團裡稱為FindClique，另外一個是化簡演算法，稱為ReduceGraph。我們可以用 FindClique 找到一個團，這個團會比之前找到的團好。當這個更好的團走到 Reduce Graph，我們知道的是：最大團至少這麼大。也是在這一步做化簡，如果圖經過化簡變為空，那麼說明找到的團就是最優解；如果沒有變成空，那麼可以減少一些點，再回去調整找團的演算法。這裡的演算法不一定是固定的演算法，可以動態地改變。

我們的一項工作選了「construct and cut」的方法，可以理解為多次貪心的演算法。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

多次貪心的作用在於，每一次貪心構造可以很快，可以從不同的起點出發，而且如果在某次構造過程中算出來，目前的團再怎麼擴展都不可能超過之前找到的團，我們就可以停止。最終目的是希望找到比以前大一些的團，啟發式要不要做得更精緻以及順序如何調整，依賴於圖的規模，就像剝洋蔥一樣，剝到某一層再精化，以便有更大精力把更好的團找出來。當圖不能再化簡的時候，我們可以採取精確的演算法，例如 Branch And Bound。找到一個團之後，根據我們的方法，我們要做 bounding 把一些點丟掉，方法在於估計點所能發展出來的團有多大，可以有不同方案去解決。

這兩個估界技術是作為例子，大家可以利用不同的技術去做。實驗方面，可以參考下表，比較 FastWClq、LSCC BMS、MaxWClq 這些方法，求解到相同精確度的時間相差十幾倍甚至數百倍。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

接下來看第二個問題：「圖著色問題」。所謂著色是給圖的每個點塗一個顏色，相鄰兩個點不能為同一個顏色，圖著色問題討論的是一個圖最少可以用多少種顏色來著色，最少顏色數叫做圖的色數。圖著色問題有很多應用，特別是在沒有衝突情況下分配資源。

這個問題大思路是一樣的 —— 啟發式求解加上一些 bounding 的技術。不同的是，圖著色問題並不要求子集合，由於要對整張圖進行著色，所以沒有“永遠扔掉”這個概念，每個點最後都要返回去，這個點一定要有一個顏色。這裡的reduce 是把圖分解為Kernel 和Margin：

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

有一個很簡單的規則，還是與獨立集有關，我如果知道這個圖片至少需要用多少種顏色，就是顏色下界（記為ℓ），則可以找到ℓ-degree bound 的獨立集合。這個獨立集的點的度數都比ℓ小，所以叫做ℓ-degree bound。如果找到這樣的獨立集，可以放心移到 Margin 裡面。如果把 kernel 的 solution 找出來之後，我們可以很方便把 Margin 合併進來，如果 kernel 是最優解，合起來一定也是最優解，這個規則可以迭代地去使用。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

我們來看一個例子，這個例子裡面灰色的四個點是 kernel，可以看到至少需要 4 種顏色。旁邊的三個點放到邊緣上，因為三個點的度數都比 4 小，我們放心把這三個點挪到旁邊先不管。然後發現剩下這個子圖分解不動，已經很硬派了，可以直接解出來。稀疏圖的硬核一般都不大，所以可以考慮精確演算法求解。如果把核心找出來，因為已知核心至少用四個顏色，對於邊緣中的點，每個點的度數小於4，怎麼樣都留有一個顏色給它，走一遍就可以了，線性的時間就可以了。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

直到最後，每一次剝離的Margin 都要保留下來，而且要標記清楚是第幾層，這是與第一個問題稍微不同的地方。我們要用額外資料結構把這些邊緣圖保留下來，最後一個剝不動的Kernel 精確化解決之後，就可以用倒序的方法，先把最後一個Margin 給合併進來，根據剛才的規則保留最優性， Kernel 是最優的話，合併一個邊緣還會是最優，一路回溯上去，那原圖的解也一定是最優的。

當這個問題變成有框架的之後，就只剩下考慮如何找 lower bound 和 upper bound。演算法的大致想法是：一開始 kernel 是原圖，需要用到最大團演算法找一個 lower bound；剝掉邊緣之後，可以採取貪心圖著色演算法，找一個 upper bound。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

這裡其實實用到了三種演算法。實務上比較常見組合拳打法，具體到做 kernel 著色，當這個圖比較大的時候，我們可能透過某種貪心或比較快的方法去做，最後有可能變成精確演算法去做。整個流程中，lower bound 和 upper bound 都是全域的，如果這兩個相等，就可以停下來了。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

#上圖是實驗結果，可以看出在稀疏大圖上面的效果更好，144 個中有97 個可以在一分鐘內證明最優解。跟同類演算法相比，我們的演算法對比時間也比較快，在比較稀疏大圖上面有特殊方法可以很快求解。大家以前認為，幾百萬頂點的 NP 難問題肯定要算很久，其實，如果這些圖很大但有一定特點的話，我們還是可以在秒級和分鐘級的時間內解決的。

阿里媽媽CTO 鄭波：阿里媽媽持續升級的決策智慧科技體系

#大家好，身為阿里媽媽科技負責人，我將從業視角分享一下過去幾年阿里媽媽在決策智慧技術上的進展。

阿里媽媽創立於 2007 年，是阿里巴巴集團的核心商業化部門，也就是網路廣告部門。經過了十多年的發展，阿里媽媽打造過「搜尋廣告淘寶直通車」這樣有影響力的產品，2009 年有了展示廣告、Ad Exchange 廣告交易平台，2014 年又出現了資料管理平台達摩盤，2016 年開始做全域行銷。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

從技術上來看的話，在2015 年、2016 年前後，阿里媽媽全面擁抱深度學習，從智慧行銷引擎OCPX 到自研CTR 預估核心演算法MLR 模型，都是隨著深度學習的方法不斷演進的。 2018 年，深度學習架構 X-Deep Learning 開源。 2019 年，Euler 圖學習框架開源，資訊流產品超級推薦也上線了，「人找貨」進化到了「貨找人」。 2020 年開始，阿里媽媽針對直播類型的廣告上線，同時開始推出互動激勵廣告，例如大家玩得比較多的互動遊戲「雙十一」疊貓貓。曲率空間學習框架也在這一年開源。

2022 年，阿里媽媽將整個廣告引擎做了重大升級。廣告引擎平台 EADS 和多媒體生產與理解平台 MDL 都上線了；在消費者隱私保護上，阿里媽媽的隱私運算技術能力獲得了中國信通院認證。回顧阿里媽媽過去十五年的發展，可以看出，我們是一家「根正苗紅」做計算廣告的公司。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

阿莉媽媽有什麼優勢呢？在非常專業的電商場域，我們對使用者和電商理解是非常強的，業務場景也非常豐富，除了傳統的搜尋推薦是傳統，在直播推廣、互動、新形態等數智業務場景上都有涉獵。此外我們的客戶規模屬於全球領先，數百萬的商家都是阿里媽媽平台的廣告客戶。這些客戶有非常多的需求，除了商家對經營的需求，還有各種各樣的生態角色涉及其中，例如主播、達人或代理商、服務商，他們以不同角色在這個平台里活躍。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

我們在 AI 方面也有比較多的研究。這裡介紹一下廣告場景演算法技術的特色。如上圖，左邊的倒漏斗型結構，很多做搜尋或推薦同學非常熟悉，這一部分廣告和搜尋推薦非常相似，包括廣告召回、粗排序、精排序到機制策略的打分，涉及到資訊檢索等大量AI技術，特別是匹配上的TDM 等召回模型都用了深度學習的技術。

其中包括決策智能，鑑於平台包含非常多的角色，各有各的博弈的關係，在多方關係和優化平衡之間，決策智能就派上了用場。使用者體驗、流量成本、預期收益、預算控制、跨域的融合，這些都是需要去博弈平衡的。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

在這裡我講講典型三個博弈 player。平台上博弈方有非常多，主要有三類：媒體、廣告主、廣告平台。

這三個部分的核心技術可以總結為：從媒體角度，專注於釋放哪些媒體資源能夠最好地平衡使用者體驗和商業化收入；從廣告主角度，要優化什麼，如何用最小的代價實現行銷目標。那麼，廣告平台的最大目標是什麼呢？長遠來說，廣告平台更底層的追求目標是讓整個平台更加繁榮，賺錢只是短期的事情，讓這個平台長期繁榮才是最終目標，所以平台要平衡各方的關係，讓各方的player 在平台上玩得很好。

廣告平台所要最佳化的目標牽涉到很多機制設計。我今天會簡單講一下智慧拍賣機制設計、智慧出價策略、智慧商業化策略三個方向，主要以科普的方式講一講阿里媽媽在這幾年這上面的工作，供大家探討。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

智慧拍賣機制設計。

先講講智慧拍賣機制設計，這是很有趣的課題，已經好多位前輩、大牛得了諾貝爾經濟學獎。我們所談的經典拍賣機制，從時間來看都是在 70 年代之前出現的，那時候網路廣告還沒出現，大家研究了很多關於單次拍賣或靜態拍賣的優化。這些機制通常都是單目標的，而且是針對單次拍賣。

無論是廣告平台或媒體，都需要平衡使用者體驗和廣告收入，典型的業界問題都是多目標最佳化，如果平台上涉及業務比較多，不同業務之間可能有平台策略和意志在裡面，這也是多目標的優化。

從最開始用經典拍賣理論，例如用 GSP 或 UGSP 方式去做流量分發和定價，業界逐漸演進到深度學習去解決這個問題。這些經典演算法透過公式去計算平台對某個目標最優化的一些參數，有了深度學習的工具之後，拍賣機制設計本身也是一個可決策問題，本身就是解決決策問題的演算法，但生產決策演算法也是決策問題。

三年前，我們基於深度學習設計了一個Deep GSP 拍賣機制，在滿足機制良好性質的前提下提升；餓平台的效果，所謂機制性質良好是指激勵相容，廣告主不用鑽牛角尖或黑灰產方式獲利，真實表達自己的意願就能夠拿到符合出價的流量。保持了激勵相容性質做的 Deep GSP，把原來靜態公式換成了可學習的深度網絡，這是第一階段的工作。

到了第二階段，拍賣機製網路裡很多參數，我們透過訓練優化的方式算出來。但實際上在整個過程中，除了參數計算還有排序，以及廣告分配的過程，是整個系統完整的組成部分。部分模組其實是不可微的，例如排序模組，因此深度學習網絡很難模擬它，為了端到端進行拍賣機制設計，我們把拍賣流程可微部分建模到神經網絡，這樣可以有梯度的反向傳導，使得模型訓練更加方便。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

智慧出價策略。

接下來講一下智慧出價策略，這是廣告主用來調節效果或博弈最主要的工具。中心化的分發無法表達訴求，但是在廣告場景中這是有辦法表達的。出價產品分為三個發展階段：

最初的經典解法也是最古老的出價，希望預算花得比較平滑，讓效果比較有保障，最初的時候業界是透過類似PID 的控制演算法，這是非常簡單的演算法，效果也比較有限。

等到了 2014、2015 年，再到 AlphaGo 打敗人類之後，我們看到了強化學習的強大力量。智能出價是一個非常典型的序列決策問題，在預算週期內，前面花的好不好會影響到後面的出價決策，而這正是強化學習的強項，因此第二階段我們用了基於強化學習的bidding ，透過MDP 建模，直接用強化學習做這個事情。

第三個階段就演進到了 SORL 這個平台，它的特點是針對強化學習中離線模擬環境與線上環境不一致。我們直接在線上環境中進行可互動的學習，這是工程設計和演算法設計聯合的例子。 SORL 上線後，很大程度上解決了強化學習強依賴模擬平台的問題。

其他的技術特色還有工程基建部分，包括智慧出價模型的訓練框架、流批一體調控系統以及多通道的投放圖化線上引擎。工程體系和演算法同樣重要，離交易中心越近、越即時，越能夠得到好的回饋，對於智慧出價來說，工程基礎建設部分越先進，越能幫助廣告主獲得更好的效果。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

智慧商業化策略。

最後講講與媒體相關的智慧商業化策略部分。在商業化策略優化上，最初的嘗試是把廣告結果和自然結果加權融合，然後混合起來，根據不同的情況挑選去放。不合理的商業化機制對使用者體驗傷害很大，大家開始意識到這個問題。最近一兩年，動態展現的策略逐漸流行起來了，隨著深度學習等技術發展，我們可以透過優化決策演算法做到平衡用戶體驗和商業化收入，在全局流量下去平衡用戶的體驗。

數智商業領域如何因應決策智慧技術的挑戰？三位專家解答

總體而言，在這三大方面，阿里媽媽形成了一張決策智慧體系圖，分為三個層面，智慧拍賣機制是中間的橋樑，智慧商業化策略解決的問題是拿出什麼樣的資源拍賣最高效，最能平衡好用戶體驗和商業化收入，智慧出價策略是面向流量精細化出價的決策過程，透過出價參數的最佳化、基於真實環境的強化學習參數尋優，或Target CPX、Max Return 等建模的範式進行最佳化。

面對現在的多輪拍賣和高頻拍賣，許多基礎理論有待進一步突破。說到基礎機制理論突破，鄧老師是這方面的專家，我們期待與鄧老師一起在這方面做出前沿性的研究。從工程實際問題的挑戰角度來看，實際環境要求在 200 毫秒返回結果，因此效率和效果上需要透過一些平衡，在工業界做得比較久對這個都有感觸。

廣告生態的最佳化是相對獨立的，平台的最終目標是希望生態欣欣向榮、和平發展，做好了這幾個，生態是否能達到預期呢？我想二者之間未必直接劃等號。對於生態優化，仍有許多理論和實際問題需要解決，這也是希望業界朋友們未來能一起去探討和解決的。

過去三年，阿里媽媽決策智慧方向在頂尖國際會議（NeurIPS、ICML、KDD、WWW 等）共發表近20 篇論文，並與北京大學、上海交大、中科院、浙江大學等多所大學及研究機構展開合作，相關成果得到了工業界和學術界的廣泛關注和跟進，在這個領域實現從跟隨到逐步引領行業的技術發展。

相對於深度學習，決策智能在業界和學術界受到關注並沒有那麼多，所以藉這個機會讓大家更多了解這個領域，這個領域是非常有趣且有前景的。以上是阿里媽媽在決策智能方面的思考和工作，希望跟業界和學術界朋友一起分享，未來能多討論，爭取在決策智能的理論研究和業界實際應用上能夠形成一些突破性的發展。

以上是數智商業領域如何因應決策智慧技術的挑戰？三位專家解答的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn