百度影片推薦跨域多目標預估與融合的實踐與思考-人工智慧-PHP中文網

百度影片推薦跨域多目標預估與融合的實踐與思考

一、百度視訊背景介紹

#1、統一產品形態

百度影片推薦跨域多目標預估與融合的實踐與思考

一方面，百度APP 的所有視訊場景已經升級成統一的沉浸式（上下滑）互動形態；另一方面，基於百度統一的大模型，我們打通了所有場景的數據和推薦體驗。互動和數據的統一可以更好地實現生態共贏，促進百度視訊的長遠發展。

為了更好地培養使用者對影片的消費習慣，我們也打造了一個影片消費的一級入口（底部導覽列入口）。大家如果有興趣可以去下載百度 APP，有好的建議和 badcase 隨時歡迎回饋給我們。

2、搜推雙引擎滿足用戶需求

#值得一提的是，百度是做搜尋起家，搜尋的使用率極高，在推薦場景中需要更好地使用搜尋的數據，透過」搜推」雙引擎來滿足用戶的需求。搜尋主要是“人找內容”，使用者會明確輸入自己的需求，而推薦是“內容找人”。將搜尋的訊號和建議的訊號進行跨域整合，做到更好的推搜融合，這也是百度的優勢之一。

百度影片推薦跨域多目標預估與融合的實踐與思考

#二、推薦系統概述

# 1.推薦系統解決的問題

百度影片推薦跨域多目標預估與融合的實踐與思考

由於聽眾中有相當一部分人對推薦技術缺乏了解，因此有必要簡單介紹推薦技術要解決的問題。推薦平台有三位玩家：

使用者：在這裡探索世界、發現新的感知。
創作者：平台推薦的基礎，為平台提供內容供給；平台為其提供廣闊的空間，激發他們無限的靈感和創作。
廣告主：提供平台生存下去的資金支持，大部分平台都是以廣告為生。

推薦平台希望實現生產、消費和收入的良性循環，推薦系統作為平台的核心部件，主要解決兩方面的問題：

優勝劣汰的內容選擇機制（B 端）：優質的內容如何獲得更多的分發，留住優質的創作者。
極致的使用者消費體驗（C 端）：只有使用者訴求得到滿足了，才能促進規模上的持續提升。

在設計目標時，我們需要綜合考慮推薦系統的兩個使命

2、推薦系統概覽

百度影片推薦跨域多目標預估與融合的實踐與思考

推薦系統的流程大致如下：審核後的資源會先推送到儲存meta 資訊的統一正排庫；推薦系統收到要求後，先通過圖引擎、多目標召回等，召回相關資源；召回之後會經過兩輪排序，分別為粗排和精排，再經過多目標的融合模型，選出一些與用戶強相關的內容；最後透過多樣性感知、序列建模、流量分配機制等策略，產生一個影片列表，下發到用戶的手機。

下面的內容將主要關注精確排列的目標設計和模型的融合

三、多目標的設計與建模

首先，我們要介紹的是多目標設計在影片推薦中的應用

1、目標設計的思考

百度影片推薦跨域多目標預估與融合的實踐與思考

#先請大家思考一下影片沉浸式的場景下，如何設計推薦系統的目標呢？

在傳統的推薦系統中，使用者透過點擊內容或影片來消費資源，從而明確表達了對該資源的喜好。因此，在傳統推薦場景中，點擊行為是非常重要的訊號，也是一種明確而簡單的回饋方式。然而，在沉浸式場景中，由於缺乏明確的回饋，使用者的喜好往往透過「隱藏」的行為來表現，此時觀看時間成為沉浸式推薦場景中極其重要的訊號

百度影片推薦跨域多目標預估與融合的實踐與思考

除了上述消費時間以外，還需要考慮使用者在系統中主動留下的行為，例如追蹤、評論、分享、按讚。然而，與播放資料相比，這些行為資料非常稀疏，可能只有千分之一這個量級

#除了這些互動訊號以外，在百度APP 的推薦裡面還有一部分很重要的數據就是搜尋訊號，在百度70% 的用戶既會消費推薦資訊流，又會用搜索，因此推薦系統也需要刻畫用戶搜尋域的滿意度訊號。

B端的創作者需要一套競爭機制，以除C端用戶滿意的消費訊號外，篩選出劣質創作者，激發優質創作者的創作潛力，從而實現生產和消費的良性循環

2、目標設計考慮的維度

百度影片推薦跨域多目標預估與融合的實踐與思考

從推薦系統角度來看，使用者就是樣本標註員，使用者有一些明確的正向表達，例如播放、按讚、收藏、留言等行為；還有一些明確的負向表達，例如Dislike、負向評論、檢舉等等。除了明確表達，使用者還會有一些隱式的表達，例如透過完播、播放時間、作者頁消費、閱讀相關推薦等表達出的喜歡，或是透過短播、快速跳脫等表達出的不喜歡。因此在設計目標的時候，要全方面地思考，平衡明確的訊號和隱式的訊號，避免設計出一個「偏科」的推薦系統。

3、綜合滿意度建模

百度影片推薦跨域多目標預估與融合的實踐與思考

#除了上述基礎目標，我們還會設計一些高階的目標，不再簡單地使用使用者的回饋。舉個例子，如上圖右側所示，我們上線了基於使用者滿意度回饋的模型。第一階段，透過完播、時長這種稠密的訊號，利用簡單的規則或模型去擬合使用者的滿意回饋，得到一個比較稠密的使用者滿意度 label。第二階段，基於這個label 建立一個滿意度模型，利用推搜全局大模型產生的Embedding、文心底層Embedding，以及使用者畫像和行為序列特徵建模，以評估推薦域相對於搜尋域的滿意度增益。如果某個興趣點用戶在搜尋裡消費過了，推薦系統可以基於該滿意度模型推薦出更優質的內容，這樣就可以使搜推融合更加平滑，將搜尋的興趣更好地遷移到 Feed。

4、長期價值建模（Long Term Value）

百度影片推薦跨域多目標預估與融合的實踐與思考

在前文介紹如何預估目前內容的播放時長與互動。我們可以利用使用者的歷史消費行為作為樣本或特徵，來預測即將推出的內容是正回饋還是負回饋，以及是否會有互動和消費的滿意情況

我們可以進一步思考，使用者未來的消費內容與目前消費的內容是否有關係？舉例來說，如果用戶現在正在觀看郭德綱的視頻，那麼如果在接下來的第N天他們繼續消費於謙的視頻，那麼這些於謙的視頻是否是由郭德綱的視頻「激發」而來的呢？消費未來的興趣點是否可以被視為當前興趣點的「延續」呢？答案是肯定的。因此，我們在系統中引入了LTV的體系，將未來長期價值的內容歸因於當前影片的推薦

百度影片推薦跨域多目標預估與融合的實踐與思考

假設V₀是當前視頻的價值，V₁，V₂，… V_n是用戶未來消費的視頻，假設V₂和V_n是滿意的消費，並且是V₀的延續，就可以歸因於V₀。

歸因方式有多種，根據百度Feed 的業務場景，歸因包含以下三大塊：

功能的歸因：如透過相關推薦看了掛載的資源，那麼這部分資源消費訊號可以歸因到V_#0##上來。
召回關聯的歸因：如召回階段是透過 itemCF 等隱含召回的。
相關性關聯：如透過多模態embedding 或推薦大模型的embedding 可以衡量資源之間的相關性，例如V #n和V#0##有比較高的相關性得分，就可以把Vn #的價值歸因到V0 上來。

當然這個歸因是有權重的，我們經過距離V

0 的時間間隔，而V₀的相關性等因子來調節用戶未來消費影片的歸因權重，從而得到當前影片V₀的長期價值。有了長期價值目標後，學習就比較簡單了，首先是目標的歸一化，然後直接建模即可。

百度影片推薦跨域多目標預估與融合的實踐與思考

基於對業務現狀的抽象和梳理，我們在設計推薦系統目標時會從以下三個方向入手進行簡單總結

多目標，先進行基礎物理目標建模，接下來是一些高階目標的建模，刻畫全場景的滿意度，同時還需要對生態進行調控。
刻畫未來的價值。
除了資源維度還可以考慮其他維度，例如作者維度的建模。

要綜合考慮各個發展方向，推薦系統的目標需要從多個角度出發

5、百度Feed 模型技術變革連動體驗演化

百度影片推薦跨域多目標預估與融合的實踐與思考

百度現在推薦場景的發展已經分為三個主要場景：

#「推薦」資訊流：已經存在了很多年。

『發現』場景：相較之下，主 Feed 偏資訊資訊，『發現』更輕鬆活潑，貼近生活。
「沉浸式」場景：純視訊形態的消費流。

百度產品的發展演變，導致了排序目標的逐步改變。最初只有單一領域的主要目標，然後發展為多領域多目標，現在已經實現了全領域的綜合建模，將多個領域的樣本整合在一起，實現資訊的充分共享。以下將介紹全領域綜合建模的具體內容

6、跨域多目標建模

首先，我們來看看業界都做了哪些工作。無論是MMoE、PLE，或是阿里在做的STAR網絡、PEPNet等這些結構，以及谷歌、騰訊等公司，都在不遺餘力地根據自己的業務設計各種各樣的網絡結構，希望在異構場景下共享更多有用的信息。這些工作主要解決了兩個問題：

跨域訊號的遷移問題，如何在兩個不同的域之間更好地遷移，實現跨域資訊共享。
多目標之間負遷移的問題，即多目標的蹺蹺板效應。

同樣百度推薦系統也面臨這兩個問題。

百度影片推薦跨域多目標預估與融合的實踐與思考

百度的場景下存在許多不同的子域目標，而這些目標之間的相關性較低，這可能導致多個目標之間發生負遷移。為了解決這個問題，需要分析不同目標之間的 PNR，並找出它們之間的相關差異。也就是說，在異質場景下如何描述使用者訊息，以及如何實現異質資訊的遷移，這是模型結構需要解決的問題

根據百度的業務需求，我們設計了一個跨域分層多目標網路結構，採用Gating 結構。這個結構主要分為三層：首先是個人化的共享網路作為底層；第二層是跨域資訊擷取的 GCG 網路；最後一層是子域的多目標網路。透過這樣的設計，我們可以在共享資訊的同時，對每個域進行多目標預估

#這套方案與單域多目標相比有著顯著提升，初次上線AUC 約提升3-9 個千分。如上圖右下角所示，取得使用者特徵在多個域的embedding，做了一個TSNE 降維後，除了搜C 和二跳這兩個比較接近以外，其它兩個場景的區分還是比較明顯的，說明模型可以學到場景間的差異。搜 C 和二跳兩個場景差別不大也是合理的，都是影片場景，使用者的互動和興趣也都差別不大。

百度影片推薦跨域多目標預估與融合的實踐與思考

百度業務場景有40 多個物理目標，還有4 個大的子域，6 種形態，包括影片、圖文、動態、小程式等。我們希望模型在眾多複雜業務中都能有較好的表現。簡單介紹一下模型結構。第一層是 common 網絡，作為分域的底座，篩選各個場景中多目標的滿意樣本，透過 gate 網路實現個人化 embedding 映射。第二層是域間資訊的擷取，將域內獨有的特徵和個人化共享特徵透過 CGC 網路實現。兩者共同建構了跨域的資訊擷取，其好處是既保留了域內的資訊豐富度，同時又提取出了異質場景的共享資訊。第三層是子域的多目標建模。這塊我們還有對應的論文在發表中，對細節有興趣的朋友可以看論文。

百度影片推薦跨域多目標預估與融合的實踐與思考

##### ######百度的多目標融合演進過程與業界相似。首先是先驗知識融合，雖然簡單直接，但需要耗費大量人力。接著我們升級到了LTR，效果顯著，但弊端是當業務變化時需要頻繁調整，同時偏序關係也會隨著業務和用戶分層的變化而變化。之後，我們採用了多目標融合價值模型，使用序列最優的方法。短期使用後，我們升級到了現在正在使用的方法——ES（Evolution Strategy）進化學習###########################要使用ES，首先需要定義一個獎勵，即北極星指標。百度的獎勵是會話的深度（時長步長）和互動，時長和步長對應的業務指標是時長和視頻播放量，這兩個指標反映了用戶的留存，即LT。此外，還有互動訊息，代表了使用者在APP中資產的積累，例如關注作者的行為，實際上是希望在作者有更新後能夠找到。不管是提高消費次數還是互動數量，都是希望使用者能更長期地使用這個APP#######

我們的初始版本是一個簡單的啟發式模型，而目前線上的 ES 則進行更高階的計算，例如引入不同場景和人群的資訊

以上是百度影片推薦跨域多目標預估與融合的實踐與思考的詳細內容。更多資訊請關注PHP中文網其他相關文章！