騰訊TRS之元學習與跨域推薦的工業實戰-人工智慧-PHP中文網

一、元學習

#1、個人化建模的痛點

2、元學習解決模型個人化問題

3、元學習（meta-learing）介紹

4、元學習演算法

6、元學習方案

7、元學習工業化實踐

二、跨域推薦" >二、跨域推薦

1、跨域推薦痛點

首頁

科技週邊

人工智慧

騰訊TRS之元學習與跨域推薦的工業實戰

王林

Jul 15, 2023 pm 03:01 PM

演算法元學習

騰訊TRS之元學習與跨域推薦的工業實戰

一、元學習

#1、個人化建模的痛點

騰訊TRS之元學習與跨域推薦的工業實戰

在推薦場景會遇到資料二八分佈的問題，20%的場景應用80%的樣本，這就導致一個問題：單一模型對大場景預估更友善。如何兼顧各場景，提升模型個人化能力是個人化建模的痛點。

業界方案：

PPNet/Poso：這個模型透過偏壓gate等個性化，效能和成本較優，但是多個場景共享一套模型參數，個人化表徵受限。
端上個人化：在每一個端部署一個模型，利用端上的即時資料進行訓練，實現端模型參數的個人化，但是會依賴端的效能，且模型不能特別大，需要使用小模型進行訓練。

針對業界模型存在的問題，我們提出如下解決想法：

利用雲端豐富算力，為每個場景部署一套模型，實現模型的極致個性化；
#模型通用性強，可應用於使用者/人群/item等個人化建模場景。

2、元學習解決模型個人化問題

騰訊TRS之元學習與跨域推薦的工業實戰

需求：為每個使用者、人群部署一套個人化的模型，模型對成本和效能是沒有損失的。
方案選型：如果每個使用者都部署一套模型，模型結構不一樣、模型參數也不一樣，會造成模型訓練和服務的成本比較高。我們考慮在同一模型結構下，為每個場景提供個人化的模型參數，來解決模型個人化的問題。
部署地點：將模型部署在雲端上，利用雲端上的豐富算力進行運算；同時想在雲端上，對模型進行靈活控制。
演算法想法：傳統的元學習是解決少樣本和冷啟動的問題，透過對演算法的充分了解，在推薦領域，運用元學習的創新性來解決模型極致個人化的問題。

整體想法是利用元學習在雲端為每個使用者部署一套個人化模型參數，最終達到對成本和效能沒有損失的效果。

3、元學習（meta-learing）介紹

騰訊TRS之元學習與跨域推薦的工業實戰

#元學習指的是學習到通用知識來指導新任務的演算法，使得網路具有快速的學習能力。例如：上圖中的分類任務：貓和鳥、花和自行車，我們將這個分類任務定義成K-short N-class 的分類任務，希望透過後設學習，學習到分類知識。在預估finetune過程，我們希望對於狗和水獺這樣的分類任務，用很少的樣本，進行微調就能得到極致的預估效果。再舉一例，我們在學習四則混合運算時，先學習加減，後學習乘除，當這兩個知識掌握了，我們就能夠學習這兩個知識融在一起如何來算，對於加減乘除混合運算，我們並不是分開來算，而是在加減乘除的基礎上，學習先乘除後加減的運算規則，再用一些樣本來訓練這個規則，以便快速了解這個規則，以至於在新的預估數據上得到比較好的效果。元學習的思路與此類似。

騰訊TRS之元學習與跨域推薦的工業實戰

傳統的學習方法，目標是學習到使得所有資料達到最優的θ，也就是全域最優的θ。元學習是以task為維度，來學習場景上的通用騰訊TRS之元學習與跨域推薦的工業實戰，在所有場景上面loss都能達到最優。傳統的學習方法學到的θ，更靠近大場景的人群，對大場景預估更好，對中長尾預估效果一般；元學習是學習到各個場景都相近的一個點，在用每個場景的資料或新的場景的資料在這個點上微調，達到各個場景最優的一個點。所以可以實現，在每個場景中建構個人化的模型參數，達到極致個人化的目標。上述實例中是以人群為task進行元學習，也適用於使用者或item為task進行建模。

騰訊TRS之元學習與跨域推薦的工業實戰

元學習有三種分類：

基於度量的方法（ Metric-based）：利用KNN、K-means等度量學習方法，來學習新的場景和當前已經存在的場景的距離，預估屬於哪一個分類，代表演算法是Convolutional Siamese、Neural Network、Matching Networks、Prototypical Networks.
基於模型的方法（Model_based）：透過memory或RNN等快速學習模型參數，代表演算法為：Memeory-Augmented、Neural Networks
基於最佳化的方法（Optimization-based）：這是近年來比較流行的方法，利用梯度下降方法為每個場景計算loss，來取得最優參數，代表演算法是MAML，目前是採用此演算法進行個人化建模。

4、元學習演算法

騰訊TRS之元學習與跨域推薦的工業實戰

##Model-Agnostic Meta-Learning (MAML)是與模型結構無關的演算法，適合通用化，分為兩部分：meta-train和finetune。

meta-train有一個初始化θ，進行兩次取樣，場景取樣和場內取樣取樣。第一步，場景採樣在這一輪採樣過程中，全體樣本有十萬甚至上百萬的task，會從上百萬的task中採樣出n個task；第二步，在每個場景上，為這個場景採樣batchsize個樣本，把batchsize個樣本分成兩部分，一部分是Support Set，另一部分是Query Set；用Support Set 使用隨機梯度下降法更新每個場景的θ；第三步，再用Query Set為每個場景計算loss；第四步，將所有的loss相加，梯度回傳給θ；整體進行多輪計算，直到滿足終止條件。其中，Support Set可以理解為訓練集合，Query Set理解為validation集合。

騰訊TRS之元學習與跨域推薦的工業實戰

Finetune過程和meta-train過程很接近，θ放在具體的場景中，取得場景的support set，利用梯度下降法（ SGD），得到場景的最優參數騰訊TRS之元學習與跨域推薦的工業實戰；使用對task場景待評分的樣本（query set）產生預估結果。

5、元學習工業化挑戰

騰訊TRS之元學習與跨域推薦的工業實戰

#將元學習演算法應用在工業化的場景中會有比較大的挑戰：元學習演算法的meta-train過程涉及兩次採樣，場景採樣和樣本採樣。對於樣本而言，需要把樣本組織好，同時按照場景的順序儲存下來並進行處理，同時需要一個字典表來儲存樣本和場景的對應關係，這個過程十分消耗儲存空間和運算效能，同時需要將樣本放到worker中進行消費，這對工業化場景有非常大的挑戰。

我們有以下的解決方法：#

解法1：在meta-train batch內進行樣本選擇，同時，對於千萬量級的模型訓練，我們修改無量框架，以便支持元學習樣本組織和千萬量級的模型訓練。傳統的模型部署方式是在每個場景中部署一套模型，這會導致千萬量級模型size非常大，訓練和serving成本增加。我們採用即調即用即釋放的方式，只儲存一套模型參數，這樣可以避免增加模型大小。同時，為了節省效能，我們只學習核心網路部分。
解法2：在serving流程進行finetune，傳統的樣本儲存鏈路，使樣本的維護成本較高，因此我們摒棄傳統的方式，只儲存中間層的數據，作為元學習的輸入。

6、元學習方案

騰訊TRS之元學習與跨域推薦的工業實戰

#首先在meta-train中實現batch內場景和樣本的選擇，每個batch內會有多條數據，每個數據屬於一個task。在一個batch內，將這些資料依照task抽取出來，抽取的樣本放到meta-train訓練過程中，這樣就解決了需要獨立維護一套場景選擇和樣本選擇的處理連結的問題。

騰訊TRS之元學習與跨域推薦的工業實戰

透過實驗研究並閱讀論文，我們發現，在fine-tune以及在元學習過程中，越接近預估層，對模型的預估效果影響越大，同時emb層對模型的預估效果影響較大，中間層對預估效果也沒有很大的影響。所以我們的想法是，元學習只選取離預估層較近的參數就可以，從成本上考慮，emb層會導致學習的成本增加，對emb層就不進行元學習的訓練了。

騰訊TRS之元學習與跨域推薦的工業實戰

整體訓練過程，如上圖中的mmoe的訓練網絡，我們對tower層的參數進行學習，其他場景的參數還是按照原始的訓練方式來學習。以user為維度來進行樣本的組織，每個使用者有自己的訓練數據，把訓練資料分成兩部分，一部分是support set，一部分是query set。在support set中，只學習local側的內容進行tower update，進行參數訓練；再用query set資料對整體的網路進行loss計算後梯度回傳，來更新整個網路的參數。

因此，整個訓練過程是：整體網路原訓練方式不變；元學習只學習核心網路；從成本方面考慮，embedding不參與元學習；loss=原loss 元loss；fintune時，把emb存放起來。 serving過程，用emb微調核心網絡，同時可用開關來控制元學習隨開隨關。

騰訊TRS之元學習與跨域推薦的工業實戰

對於傳統的樣本儲存方式，如果在serving過程，直接進行finetune，會存在較嚴重的問題：需要在線上維護一套樣本儲存鏈路；多套線上實驗需要維護多套樣本。同時，finetune流程，用原始樣本進行finetune，樣本要經過emb層、bottom layers層以及meta-learning層，但是元學習在serving過程只需要學習meta-learning layers，不關心其他部分。我們考慮在serving過程，只保存meta-learning input 存到模型中，這樣就能節省樣本鏈路的維護，同時達到一定的效果，如果只存emb這一部分，可節省該部分的計算成本和維護成本。

我們採用如下的方法：

把儲存放到模型的lookup table中，lookup table 會被認為是一個dense 的variables，儲存在ps中，所有的參數都會pull到worker 上，更新時，也會push到所有的variables ,這樣會增加網路的耗時。另一種方式是使用無量HashTable，HashTable是以key、value的形式存儲，key是場景，value是meta layer的input，這樣做的好處是，只需將所需要的場景的input layer從ps上進行push或pull，整體會節省網路的耗時，所以我們取樣該方法來儲存meta layer 的input。同時，如果將meta-learning layers 儲存到模型中，會使得模型變大，也會遇到過期的問題，導致和目前的模型不匹配，我們使用時間淘汰極致來解決該問題，即淘汰掉過期embedding ,這樣既使得模型變小，也能解決即時性的問題。

騰訊TRS之元學習與跨域推薦的工業實戰

這個模型在serving 階段，會使用embedding，embedding輸入到bottom layers，打分數時，並不像原始的方式一樣，而是透過meta-learning layers拿到support set 中的數據，將該層的參數更新，使用更新後的參數進行評分。這個過程在GPU上無法進行計算，因此我們在CPU上執行該過程。同時，無量GPU推理做了Auto Batch合併，將多個請求進行合併，合併後的請求在GPU上進行計算，這樣處理，梯度會隨著batch的增加而變化，針對該問題，我們在batch和grad的基礎上，增加一個num維度，計算梯度時，將grad進行相加，並依照num 處理後，維持梯度的穩定性。最終實現成本和性能可控，同時實現了千境千模。

7、元學習工業化實踐

騰訊TRS之元學習與跨域推薦的工業實戰

#借助框架、元件將元學習通用化，用戶在存取時，只需修改模型程式碼，使用者無需關心訓練和serving，只需調用我們已經實現好的接口，例如：support set讀寫接口、meta-train和finetune實現接口以及GPU serving適配接口等。用戶只需傳入loss、task inputs、label等業務相關參數。這樣設計，節省了演算法工程師調查、開發、實驗和試錯的成本，提升了演算法的迭代效率；同時，通用化的程式碼，可服務多個業務場景，節省人力和資源成本。

騰訊TRS之元學習與跨域推薦的工業實戰

元學習在雙塔召回場景下的使用，是以使用者為維度進行建模，包括user塔和item塔。模型的優點是：可插拔，無需改動樣本和線上架構，穩定無風險；缺點是support set是前一個小時的數據，有即時性的問題。

騰訊TRS之元學習與跨域推薦的工業實戰

元學習的另一個應用場景是在序列召回場景，該場景是以使用者為場景來建模，以使用者的行為序列作為support set，用戶行為序列只有正樣本，我們會維護一個負樣本隊列，採樣隊列中樣本做為負樣本，並拼接上正樣本作為support set。這樣做的好處是：即時性更強，成本更低。

騰訊TRS之元學習與跨域推薦的工業實戰

最後，元學習也應用在排序場景中，如上圖的mmoe精排模型，實作方式有兩種：只使用finetune ，以及同時使用meta-train和finetune。第二種實現方式效果更優。

騰訊TRS之元學習與跨域推薦的工業實戰

元學習在不同的場景中都取得了較好的效益。

二、跨域推薦

1、跨域推薦痛點

騰訊TRS之元學習與跨域推薦的工業實戰

每個場景有多個建議的入口，需要為每個場景建立一套召回、粗排到精排的鏈路，成本較高。尤其小場景和中長尾流量資料稀疏，優化空間受限。我們能否將一個產品內相似推薦入口的樣本、離線訓練和線上服務融合成一套，達到節省成本並提升效果的目的。

騰訊TRS之元學習與跨域推薦的工業實戰

但是，這樣做也存在著一定的挑戰。在瀏覽器上搜尋谷愛凌，會出現相關搜尋字詞，點擊具體的內容並返回後，會出現結果點擊後的推薦，這兩種的流量佔比、點擊率以及特徵分佈的差異都比較大，同時在預估目標上也有差異。

騰訊TRS之元學習與跨域推薦的工業實戰

如果將跨域的模型使用多任務模型，就會產生比較嚴重的問題，並不能拿到比較好的收益。

騰訊TRS之元學習與跨域推薦的工業實戰

在騰訊實現跨場景建模具有較大挑戰。首先在其他企業，兩個場景的特徵能夠一一對應，但在騰訊的跨域推薦領域兩個場景的特徵無法對齊，一條樣本只能屬於一個場景，數據分佈差異大，預估目標難對齊。

騰訊TRS之元學習與跨域推薦的工業實戰

針對騰訊跨域推薦場景的個人化需求，採用上述方式進行處理。對於通用特徵進行shared embedding，場景個性化的特徵自己獨立embedding空間，在模型部分，有共享的expert和個性化的expert，所有的數據都會流入共享的expert，每個場景的樣本會數據各自的個性化expert，透過個人化gate將共享expert和個人化expert融合，輸入到tower，用star的方式來解決不同場景的目標稀疏的問題。對於expert部分，可以採用任意的模型結構，例如Share bottom、MMoE、PLE，也可以是業務場景上的全模型結構。此方式的優點是：模型的通用性強，適合各類模型融合接入；由於可以直接將場景expert遷移，對原場景效果無損，實現跨場景知識遷移效果提升；融合後模型減小，訓練速度提升，同時節省成本。

騰訊TRS之元學習與跨域推薦的工業實戰

我們進行了通用化建設，紅色部分是需要個人化存取的內容，例如：個人化特徵、個人化模型結構等，使用者只需寫入個人化的程式碼即可。其他部分，我們已經將整套程式碼連接到ModelZoo，可直接繼承使用，並將其封裝成機器學習平台工作流程元件，可直接運行，該方式減少了多場景學習研究和存取成本。

騰訊TRS之元學習與跨域推薦的工業實戰

這種方式讓樣本量變多，模型結構變得複雜，但效率反而提升了。原因如下：由於一些特徵是共享的，融合後的特徵數比兩個場景特徵數的加和要少；由於shared embedding的功能，batch內key均值，比兩個場景的加和要小；減小了從server端pull或push的時間，從而節省了通訊耗時，整體降低了訓練耗時。

多場景的融合能使整體成本減少：離線樣本處理，能夠減少21%的成本；採用CPU追數據，會節省24%的成本，同時模型的迭代時間也會減少40%，線上訓練成本、線上服務成本、模型大小都會降低，所以全鏈路的成本降低了。同時，將多個場景的資料融合在一起，更適合GPU運算，將兩個單一場景的CPU融合到GPU上，節省的比例會更高。

騰訊TRS之元學習與跨域推薦的工業實戰

跨域推薦可透過多種方式來使用。第一種，多場景單目標的模型結構，可直接使用多場景的建模架構，不建議使用tower側的star；第二種，多場景多目標的融合，可直接使用多場景的建模框架；第三種，同一個精排產品，不同目標模型融合，可直接使用多場景建模框架，不建議使用tower側的star；最後一種，同產品多個召回、粗排模型融合，目前正在進行中。

騰訊TRS之元學習與跨域推薦的工業實戰

跨域推薦不僅在效果上有提升，在成本上也省了很多。

以上是騰訊TRS之元學習與跨域推薦的工業實戰的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7560

CakePHP 教程

1384

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

CLIP-BEVFormer：明確監督BEVFormer結構，提升長尾偵測性能 Mar 26, 2024 pm 12:41 PM

寫在前面&筆者的個人理解目前，在整個自動駕駛系統當中，感知模組扮演了其中至關重要的角色，行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後，才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前，具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息，用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點，以及其輸出結果能便捷地應用於各種下游任務，因此受到工業

使用C++實現機器學習演算法：常見挑戰及解決方案 Jun 03, 2024 pm 01:25 PM

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫，並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法，有效地管理記憶體和使用高效能矩陣操作。

探究C++sort函數的底層原理與演算法選擇 Apr 02, 2024 pm 05:36 PM

C++sort函數底層採用歸併排序，其複雜度為O(nlogn)，並提供不同的排序演算法選擇，包括快速排序、堆排序和穩定排序。

人工智慧可以預測犯罪嗎？探索CrimeGPT的能力 Mar 22, 2024 pm 10:10 PM

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統，用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測：基礎知識CrimeGPT利用機器學習演算法來分析大量資料集，識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢，人工智慧可以為執法機構

改進的檢測演算法：用於高解析度光學遙感影像目標檢測 Jun 06, 2024 pm 12:33 PM

01前景概要目前，難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法，利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集，新演算法的mAP比YOLOv5好2.2%，比YOLOX好8.48%，在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展，高解析度光學遠感影像已被用於描述地球表面的許多物體，包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

九章雲極DataCanvas多模態大模型平台的實踐與思考 Oct 20, 2023 am 08:45 AM

一、多模態大模型的歷史發展上圖這張照片是1956年在美國達特茅斯學院舉行的第一屆人工智慧workshop，這次會議也被認為拉開了人工智慧的序幕，與會者主要是符號邏輯學屆的前驅（除了前排中間的神經生物學家PeterMilner）。然而這套符號邏輯學理論在隨後的很長一段時間內都無法實現，甚至到80年代90年代還迎來了第一次AI寒冬期。直到最近大語言模型的落地，我們才發現真正承載這個邏輯思維的是神經網絡，神經生物學家PeterMilner的工作激發了後來人工神經網絡的發展，也正因為此他被邀請參加了這個

演算法在 58 畫像平台建置中的應用 May 09, 2024 am 09:01 AM

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠，建立用戶畫像平台依賴數據倉儲建模能力，整合多業務線數據，建構準確的用戶畫像；還需要數據挖掘，理解用戶行為、興趣和需求，提供演算法側的能力；最後，還需要具備數據平台能力，有效率地儲存、查詢和共享用戶畫像數據，提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於，業務自建畫像平台服務單條業務線，按需定制；中台平台服務多條業務線，建模複雜，提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

即時加SOTA一飛沖天！ FastOcc：推理更快、部署友善Occ演算法來啦！ Mar 14, 2024 pm 11:50 PM

寫在前面&筆者的個人理解在自動駕駛系統當中，感知任務是整個自駕系統中至關重要的組成部分。感知任務的主要目標是使自動駕駛車輛能夠理解和感知周圍的環境元素，如行駛在路上的車輛、路旁的行人、行駛過程中遇到的障礙物、路上的交通標誌等，從而幫助下游模組做出正確合理的決策和行為。在一輛具備自動駕駛功能的車輛中，通常會配備不同類型的信息採集感測器，如環視相機感測器、雷射雷達感測器以及毫米波雷達感測器等等，從而確保自動駕駛車輛能夠準確感知和理解周圍環境要素，使自動駕駛車輛在自主行駛的過程中能夠做出正確的決斷。目

See all articles

騰訊TRS之元學習與跨域推薦的工業實戰

一、元學習

#1、個人化建模的痛點

2、元學習解決模型個人化問題

3、元學習（meta-learing）介紹

4、元學習演算法

5、元學習工業化挑戰

6、元學習方案

7、元學習工業化實踐

二、跨域推薦

1、跨域推薦痛點

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題