目錄
一、问题背景:冷启动建模的必要性和重要性
二、技术方案:特征选取、模型建模
三、總結
四、問答環節
Q1:音樂冷啟動的核心指標是什麼?
Q2:多模態特徵是端對端訓練還是預訓練出的?第二步比較視圖產生時,輸入 x 具體是什麼特徵?
Q3:對比學習訓練時兩組增強的塔的embedding 層和DNN 都是共享的嗎?為什麼對比學習對於內容冷啟動有效,是會專門針對非冷啟動內容做負採樣嗎?
Q4:興趣邊界那裡是多目標建模嗎?看起來不太像,可以介紹一下 ⍺ 和 p 這兩個量嗎?
Q5: 用戶塔(userTower)和興趣邊界塔在結構上有什麼區別,看起來輸入似乎是一樣的?
首頁 科技週邊 人工智慧 關於網易雲音樂冷啟動技術的推薦系統

關於網易雲音樂冷啟動技術的推薦系統

Nov 14, 2023 am 08:14 AM
推薦系​​統 冷啟動技術

關於網易雲音樂冷啟動技術的推薦系統

一、问题背景:冷启动建模的必要性和重要性

關於網易雲音樂冷啟動技術的推薦系統

作为一个内容平台,云音乐每天都会有大量的新内容上线。虽然相较于短视频等其他平台,云音乐平台的新内容数量相对较少,但实际数量可能远远超出大家的想象。同时,音乐内容与短视频、新闻、商品推荐又有着显著的不同。音乐的生命周期跨度极长,通常会以年为单位。有些歌曲可能在沉寂几个月、几年之后爆发,经典歌曲甚至可能经过十几年仍然有着极强的生命力。因此,对于音乐平台的推荐系统来说,发掘冷门、长尾的优质内容,并把它们推荐给合适的用户,相比其他类目的推荐显得更加重要

冷门、长尾的 item(歌曲)由于缺乏用户交互数据,对于主要依赖行为数据的推荐系统来说,想要做到精准分发是非常困难的。理想情况是允许拿出一小部分流量做探索分发,在探索中积累数据。但是,线上的流量又十分珍贵,探索往往容易破坏用户体验。而推荐作为直接对业务指标负责的角色,不允许我们为这些长尾 item 做过多不确定的探索。因此,我们需要做到从一开始就能较为精准地找到 item 潜在的目标用户,也就是零交互记录 item 冷启动。

二、技术方案:特征选取、模型建模

接下来分享云音乐采用的技术方案。

關於網易雲音樂冷啟動技術的推薦系統

核心问题是如何找到冷启动项目的潜在目标用户。我们将问题分为两个部分:

在没有用户点击播放的情况下,冷启动项目还有哪些有效的信息可以作为特征帮助我们进行分发?这里我们采用了音乐的多模态特征

如何利用这些特征来做好冷启动分发建模?针对这一点,我们将分享两个主要的建模方案:

  • I2I建模:自引导对比学习增强冷启算法。
  • U2I建模:多模态 DSSM 用户兴趣边界建模。

關於網易雲音樂冷啟動技術的推薦系統

重新写成中文: 歌曲本身是一种多模态信息,除了语种、曲风等标签信息外,歌曲的音频和文本(包括歌名和歌词)中包含了丰富的信息。理解这些信息,并发现它们与用户行为之间的关联性,是成功进行冷启动的关键。目前,云音乐平台采用了CLIP框架来实现多模态特征表达。对于音频特征,首先采用一些音频信号处理方法,将其转换为视频领域的形式,然后使用序列模型如Transformer进行特征提取和建模,最终得到一个音频向量。对于文本特征,采用BERT模型进行特征提取。最后,使用CLIP的自监督预训练框架,将这些特征进行序列化,得到歌曲的多模态表示

对于多模态建模,业界有两种做法。一种是将多模态特征放到业务的推荐模型中进行端到端的一阶段训练,但这种方法的成本较高。因此,我们选择了两阶段的建模。首先进行预训练建模,然后将这些特征输入到下游业务的召回模型或精排模型中进行使用。

關於網易雲音樂冷啟動技術的推薦系統

如何将一首没有用户交互行为的歌曲分发给用户呢?我们采用的是间接建模方案:把歌曲到用户(I2U)问题转化为歌曲-相似歌曲-用户(I2I2U)问题,即先找到与这首冷启动歌曲相似的歌曲,然后这些相似的歌曲与用户有一些历史交互记录,例如收藏等比较强的信号,可以找到一批目标用户。然后将这首冷启动歌曲分发给这些目标用户。

關於網易雲音樂冷啟動技術的推薦系統

具體的做法如下,首先第一步是監督學習的任務。在歌曲特徵方面,除了剛才提到的多模態訊息外,還包括歌曲的標籤訊息,如語種、曲風等,以此來幫助我們進行個人化建模。我們將所有特徵聚合到一起,輸入到一個編碼器中,最終輸出歌曲向量,每個歌曲向量的相似度可以透過向量內積來表示。學習的目標是基於行為計算出的I2I的相似度,即協作過濾的相似度,我們在協同過濾資料的基礎上加了一層後驗校驗,即基於I2I推薦後,用戶回饋效果較好的一對項目對作為學習的正樣本,以確保學習目標的準確度。負樣本採用全域隨機採樣建構。損失函數採用BPR損失。這是推薦系統中非常標準的CB2CF的做法,即基於歌曲的內容、標籤資訊去學習歌曲在使用者行為特徵上的相似度

關於網易雲音樂冷啟動技術的推薦系統

在上述方法的基礎上,我們引入了對比學習作為第二步驟的迭代。我們之所以選擇引入對比學習,是因為在這套流程學習中,我們仍然使用CF數據,並且需要透過使用者的互動行為來進行學習。然而,這樣的學習方法可能導致一個問題,即學習到的物品會存在「熱門物品學得多,冷門物品學得少」的偏差。雖然我們的目標是從歌曲的多模態內容到歌曲的行為相似性進行學習,但在實際訓練中發現仍然存在熱門和冷門的偏差問題

因此我們引入了一套對比學習演算法,旨在增強冷門Item 的學習能力。首先,我們需要有一個 Item 的表徵,這個表徵是經由先前多模態 encoder 學習得到的。然後,對這個表徵進行兩個隨機變換,這是 CV 中一些常見的做法,在特徵上做隨機的 mask 或加噪。由同一個Item 產生的兩個隨機變化的表徵被認為是相似的,由不同Item 產生的兩個表徵被認為是不相似的,這樣的對比學習機制是對冷啟動學習的數據增強,透過這樣的方式產生對比學習知識庫樣本對。

關於網易雲音樂冷啟動技術的推薦系統

在特徵增強的基礎上,我們也加入了關聯分組機制

重寫後的內容如下: 關聯分組機制:首先計算每對特徵之間的相關性,即維持一個相關性矩陣,並在模型訓練過程中更新此矩陣。然後根據特徵之間的相關性將特徵分為兩組。具體操作是,隨機選擇一個特徵,將與該特徵最相關的一半特徵放入一組,將剩餘的放入另一組。最後,對每組特徵進行隨機變換,從而產生對比學習的樣本對。這樣,每個批次內的N個項目將產生2N個視圖。來自同一專案的一對視圖作為對比學習的正樣本,來自不同項目的一對視圖作為對比學習的負樣本。比較學習的損失採用資訊歸一化交叉熵(infoNCE),並與前面監督學習部分的BPR損失結合,作為最終的損失函數

關於網易雲音樂冷啟動技術的推薦系統

##線上部署和推理流程:在離線訓練完成後,對所有現有歌曲建立向量索引。對於一個新的冷啟動項目,透過模型推理得到它的向量,然後從向量索引中檢索出與之最相似的一些項目,這些項目是過去的存量項目,因此有一批與它們有過歷史交互行為的用戶(如播放、收藏等),將這個需要冷啟動的項目分發給這批用戶,完成對該項目的冷啟動

關於網易雲音樂冷啟動技術的推薦系統

我們對此冷啟動演算法進行了評估,包括離線和線下指標的評估,取得了非常好的效果,如上圖所示,冷啟動模型計算得到的歌曲表徵對不同曲風的歌曲可實現優秀的聚類效果。部分成果已有公開論文發表(Bootstrapping Contrastive Learning Enhanced Music Cold-Start Matching)。在線上,該冷啟動演算法在找到更多的潛在目標用戶( 38%)的同時,也實現了冷啟動item 的收藏率( 1.95%)、完播率( 1.42%)等業務指標的提升。

關於網易雲音樂冷啟動技術的推薦系統

我們進一步思考:

  • #在上述I2I2U 的方案中,未使用任何用戶側特徵。
  • 如何引入使用者特徵幫助 Item 冷啟動?

關於網易雲音樂冷啟動技術的推薦系統

U2I 冷啟動方案採用多模態 DSSM 建模方法。該模型由一個 ItemTower 和一個 UserTower 組成。我們將先前歌曲的多模態特徵繼承到 ItemTower 中,用戶塔創建了一個常規的用戶塔。我們對使用者序列進行了多模態的學習建模,模型訓練基於全量的item 空間,無論是冷門還是熱門歌曲,都會作為樣本去訓練模型。推理時,只對圈選好的新歌或冷門歌曲池進行推理。這樣的做法與之前一些雙塔方案類似:對於熱門的item,建造一個塔,對於新的或冷門的 item,建造另一個塔來處理。然而,我們更獨立地處理了常規的 item 和冷啟動的 item。我們為常規的item 使用常規的召回模型,而對於冷門的item,則使用專門構建的DSSM 模型

關於網易雲音樂冷啟動技術的推薦系統

由於冷啟動的DSSM模型只用於對冷門或新歌曲進行推理,我們發現對使用者的BIAS 進行建模非常重要,因為我們無法保證所有使用者都喜歡冷門或新的Item。候選集本身就是一個非常大的池子,我們需要對使用者 Item 進行建模,因為某些使用者可能偏好熱門Item,而推薦池中可能缺少他喜歡的 Item。因此,在傳統方法的基礎上,我們建立了一種稱為「興趣邊界」的塔來對使用者的偏好進行建模。利用興趣邊界將正負樣本分開,訓練時,使用興趣邊界分數劃分每個使用者的正負樣本;推理時,比較物品得分和使用者興趣邊界得分來決定是否推薦該物品。訓練時,我們使用興趣邊界向量和使用者興趣向量進行內積計算來得到邊界的表徵向量。在上圖 loss 基礎上,使用傳統二分類的交叉熵做建模。負樣本會將使用者興趣邊界抬高,而正樣本會將使用者興趣邊界壓低,最終,訓練後會達到一個平衡狀態,使用者的興趣邊界將正負樣本分開。在線上應用時,我們根據使用者的興趣邊界來決定是否將冷門或長尾的 Item 推薦給該使用者。

三、總結

關於網易雲音樂冷啟動技術的推薦系統

#最後做一個總結。雲音樂推薦的多模態冷啟建模主要工作包括:

  • #特徵方面,採用了CLIP 預訓練框架下對多模態進行建模。
  • 建模方案上採用了兩種建模方案,I2I2U 間接建模和冷啟動多模態 DSSM 直接建模。
  • Loss & 學習目標上,Item 側引入了 BPR & 對比學習,User 側興趣邊界增強冷門 Item 學習和使用者學習。

未來的最佳化主要有兩個方向。第一個方向是透過內容和行為特徵的多模態融合建模。第二個方向是對召回和排序進行全鏈路最佳化

#

四、問答環節

Q1:音樂冷啟動的核心指標是什麼?

A1:我們會關注多面向的指標,其中比較重要的是收藏率和完播率,收藏率=收藏PV/播放PV,完播率=完整播放的PV/播放PV。

Q2:多模態特徵是端對端訓練還是預訓練出的?第二步比較視圖產生時,輸入 x 具體是什麼特徵?

A2:我們目前採用的方案是基於 CLIP 框架進行預訓練,並利用預訓練得到的多模態特徵來支援下游的召回和排序業務。我們的預訓練過程是分成兩個階段進行的,而不是端到端的訓練。雖然從理論上來說,端到端的訓練可能效果更好,但相應地,對機器的要求和成本也更高。因此,我們選擇預訓練這個方案,這也是出於成本方面的考慮

x表示歌曲的原始特徵,包括歌曲的音頻、文本多模態特徵以及語種曲風等標籤類特徵。這些特徵經過分組和兩個不同的隨機變換F’a和F’’a得到x’和x’’。 f是編碼器,也是模型的主幹結構,g加在編碼器輸出之後的一個頭部,僅用於對比學習部分

Q3:對比學習訓練時兩組增強的塔的embedding 層和DNN 都是共享的嗎?為什麼對比學習對於內容冷啟動有效,是會專門針對非冷啟動內容做負採樣嗎?

A3:模型總是只有一個編碼器,也就是一個塔,所以沒有參數共享的問題

關於為什麼對冷門的物品有幫助,我這樣理解,不需要對冷門物品進行額外的負採樣等工作。實際上,僅僅在監督學習的基礎上學習歌曲的嵌入表示可能會導致偏差,因為學習的是協同過濾的數據,會導致偏好熱門歌曲的問題,最終嵌入向量也會有偏差。透過引入對比學習機制,在最終的損失函數中引入對比學習的損失,可以校正學習協同過濾資料的偏差。因此,透過對比學習的方式,可以改善向量在空間上的分佈,而不需要對冷門物品進行額外處理

Q4:興趣邊界那裡是多目標建模嗎?看起來不太像,可以介紹一下 ⍺ 和 p 這兩個量嗎?

A4:多模態DSSM建模中包含一個ItemTower和一個UserTower,然後在UserTower的基礎上,我們對使用者特徵額外建模了一個塔,稱為興趣邊界塔。這三個塔分別輸出一個向量。在訓練時,我們會對物品向量和使用者向量進行內積,得到物品得分,然後將使用者向量和使用者的興趣邊界向量進行內積,表示使用者的興趣邊界得分。參數⍺是一個常規的樣本加權參數,用來平衡正負樣本對損失的貢獻比例。 p是物品最終得分,計算方式為將物品向量和使用者向量的內積分數減去使用者向量和使用者興趣邊界向量的內積得分,並透過sigmoid函數計算得到的最終得分。在計算過程中,正樣本會提高物品和使用者內積的分數,降低使用者和使用者興趣邊界的內積得分,負樣本則相反。理想情況下,使用者和使用者興趣邊界的內積得分可以區分正負樣本。在線上推薦階段,我們使用興趣邊界作為參考值,將得分較高的物品推薦給用戶,而得分較低的物品則不推薦。如果一個使用者只對熱門物品感興趣,那麼理想情況下,這個使用者的邊界分,也就是他的使用者向量與他的興趣邊界向量的內積會非常高,甚至高於所有的冷啟動物品得分,因此不會向該用戶推薦一些冷啟動的物品

Q5: 用戶塔(userTower)和興趣邊界塔在結構上有什麼區別,看起來輸入似乎是一樣的?

A5:這兩者的輸入確實是一樣的,結構也是類似的,只是參數不共享。最大的差異只在於損失函數的計算上。使用者塔的輸出與物品塔的輸出進行內積計算,得到的是物品得分。興趣邊界塔的輸出與使用者塔的輸出進行內積計算,得到的是邊界分。在訓練時,將這兩者相減後參與二分類損失函數的計算,而在推理時,則比較這兩者的大小來決定是否將該物品推薦給用戶

以上是關於網易雲音樂冷啟動技術的推薦系統的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

如何使用Go語言和Redis實現推薦系統 如何使用Go語言和Redis實現推薦系統 Oct 27, 2023 pm 12:54 PM

如何使用Go語言和Redis實現推薦系統推薦系統是現代網路平台中重要的一環,它幫助使用者發現和獲取感興趣的資訊。而Go語言和Redis是兩個非常流行的工具,它們在實現推薦系統的過程中能夠發揮重要作用。本文將介紹如何使用Go語言和Redis來實作一個簡單的推薦系統,並提供具體的程式碼範例。 Redis是一個開源的記憶體資料庫,它提供了鍵值對的儲存接口,並支援多種數據

利用Java實現的推薦系統演算法與應用 利用Java實現的推薦系統演算法與應用 Jun 19, 2023 am 09:06 AM

隨著網路技術的不斷發展和普及,推薦系統作為一種重要的資訊過濾技術,越來越受到廣泛的應用和關注。在實作推薦系統演算法方面,Java作為一種快速、可靠的程式語言,已被廣泛應用。本文將介紹利用Java實現的推薦系統演算法和應用,並著重介紹三種常見的推薦系統演算法:基於使用者的協同過濾演算法、基於物品的協同過濾演算法和基於內容的推薦演算法。基於用戶的協同過濾演算法是基於用戶的協同過

應用實例:使用go-micro 建置微服務推薦系統 應用實例:使用go-micro 建置微服務推薦系統 Jun 18, 2023 pm 12:43 PM

隨著網路應用的普及,微服務架構成為目前較受歡迎的架構方式。其中,微服務架構的關鍵在於將應用程式拆分為不同的服務,透過RPC方式進行通信,實現鬆散耦合的服務架構。在本文中,我們將結合實際案例,介紹如何使用go-micro建構一個微服務推薦系統。一、什麼是微服務推薦系統微服務推薦系統是一種基於微服務架構的推薦系統,它將推薦系統中的不同模組(如特徵工程、分類

精準推薦的秘術:阿里解耦域適應無偏召回模型詳解 精準推薦的秘術:阿里解耦域適應無偏召回模型詳解 Jun 05, 2023 am 08:55 AM

一、場景介紹首先來介紹本文涉及的場景—「有好貨」場景。它的位置是在淘寶首頁的四宮格,分為一跳精選頁和二跳承接頁。承接頁主要有兩種形式,一種是圖文的承接頁,另一種是短視頻的承接頁。這個場景的目標主要是為使用者提供滿意的好貨,帶動GMV的成長,從而進一步撬動達人的供給。二、流行度偏差是什麼,為什麼接下來進入本文的重點,流行度偏差。流行度偏差是什麼?為什麼會產生流行度偏差? 1.流行度偏差是什麼流行度偏差有很多別名,例如馬太效應、資訊繭房,直觀來講它是高爆品的狂歡,越熱門的商品,越容易曝光。這會導致

Go語言如何實現雲端搜尋和推薦系統? Go語言如何實現雲端搜尋和推薦系統? May 16, 2023 pm 11:21 PM

隨著雲端運算技術的不斷發展和普及,雲端搜尋和推薦系統也越來越得到了人們的青睞。而針對這項需求,Go語言也提供了很好的解決方案。在Go語言中,我們可以利用其高速的並發處理能力和豐富的標準庫來實現一個高效的雲端搜尋和推薦系統。以下將介紹Go語言如何實現這樣的系統。一、雲上搜尋首先,我們需要對搜尋的姿勢和原理進行了解。搜尋姿勢指的是搜尋引擎根據使用者輸入的關鍵字來配對頁面

關於網易雲音樂冷啟動技術的推薦系統 關於網易雲音樂冷啟動技術的推薦系統 Nov 14, 2023 am 08:14 AM

一、问题背景:冷启动建模的必要性和重要性作为一个内容平台,云音乐每天都会有大量的新内容上线。虽然相较于短视频等其他平台,云音乐平台的新内容数量相对较少,但实际数量可能远远超出大家的想象。同时,音乐内容与短视频、新闻、商品推荐又有着显著的不同。音乐的生命周期跨度极长,通常会以年为单位。有些歌曲可能在沉寂几个月、几年之后爆发,经典歌曲甚至可能经过十几年仍然有着极强的生命力。因此,对于音乐平台的推荐系统来说,发掘冷门、长尾的优质内容,并把它们推荐给合适的用户,相比其他类目的推荐显得更加重要冷门、长尾的

因果糾偏法在螞蟻行銷推薦場景中的應用 因果糾偏法在螞蟻行銷推薦場景中的應用 Jan 13, 2024 pm 12:15 PM

一、因果糾偏的背景1、偏差的產生在推薦系統中,透過收集資料來訓練推薦模型,以向使用者推薦合適的物品。當使用者與推薦的物品互動時,收集的資料又會用於進一步訓練模型,形成一個閉環循環。然而,這個閉環中可能存在各種影響因素,導致誤差的產生。主要的誤差原因在於訓練模式所使用的數據大多是觀測數據,而非理想的訓練數據,受到曝光策略和使用者選擇等因素的影響。這種偏差的本質在於經驗風險估計的期望和真實理想風險估計的期望之間的差異。 2.常見的偏差推薦行銷系統裡面比較常見的偏差主要有以下三種:選擇性偏差:是由於使用者根

PHP中的推薦系統與協同過濾技術 PHP中的推薦系統與協同過濾技術 May 11, 2023 pm 12:21 PM

隨著網路的快速發展,推薦系統變得越來越重要。推薦系​​統是一種用於預測使用者感興趣的物品的演算法。在網路應用程式中,推薦系統可以提供個人化建議和推薦,從而提高用戶滿意度和轉換率。 PHP是一種被廣泛應用於Web開發的程式語言。本文將探討PHP中的建議系統與協同過濾技術。推薦系​​統的原理推薦系統依賴機器學習演算法和資料分析,它透過對使用者歷史行為進行分析,預測

See all articles