正確なレコメンデーションの秘密: アリババの分離ドメイン適応不偏リコール モデルの詳細な説明
#1. シーン紹介
##最初のこの記事に関係するシナリオ、「良い商品が入手可能」のシナリオを紹介しましょう。その場所はタオバオのホームページ上の 4 つの正方形のグリッド内にあり、1 ホップの選択ページと 2 ホップの承認ページに分かれています。受付ページには主に 2 つの形式があり、1 つは画像とテキストの受付ページ、もう 1 つは短いビデオの受付ページです。このシナリオの主な目標は、ユーザーに満足のいく商品を提供し、GMV の成長を促進し、それによって専門家の供給をさらに活用することです。
2. 人気バイアスとは何か、その理由
次に、この記事の焦点である人気バイアスについて説明します。人気バイアスとは何ですか?人気の偏りはなぜ起こるのでしょうか?
#1. 人気バイアスとは
人気バイアスには、 マシュー効果、情報コクーン ルーム、 など、さまざまな別名があり、直感的に言えば爆発性の高い製品のカーニバルであり、人気のある製品ほど露出されやすくなります。そうなると、高品質なロングテール商品や専門家が作った新商品が露出する機会がなくなってしまいます。弊害は主に2つあり、1つ目はユーザーのパーソナライゼーションの欠如、2つ目は専門家が作った新製品の露出が少なく、専門家の参加意識が低下することです。人気の偏り。
上の図の右側にある青色のヒストグラムからわかるように、露出された上位 10% の製品が、ある市場での露出の 63% を占めています。ある日のこと、これは『マシュー』では良い商品があるときの効果が非常に深刻であることを証明しています。
2. 人気バイアスはなぜ発生するのでしょうか?
次に、人気バイアスがなぜ発生するのかを考えてみましょう。まず、なぜリコール切り捨てにおける人気度のバイアスを軽減する作業を行うのかを明確にする必要があります。ランキング モデルは商品の CTR に適合し、そのトレーニング サンプルにはポジティブ サンプルとネガティブ サンプルが含まれており、CTR が高い商品ほど露出が増える可能性が高くなります。しかし、リコール段階では、通常、ツインタワー モデルを使用します。そのネガティブ サンプルは、通常、2 つの方法で生成されます。1 つ目は、グローバル ランダム ネガティブ サンプリングで、2 つ目は、バッチ内ネガティブ サンプリングです。バッチ内ネガティブ サンプリングは、同じバッチでは、陽性サンプルの他の曝露ログを陰性サンプルとして取得するため、マシュー効果をある程度軽減できます。ただし、実験を通じて、グローバル ネガティブ サンプリングの実際のオンライン効率効果はより優れていることがわかりました。ただし、レコメンダー システムにおけるグローバル ランダムなネガティブ サンプリングは、モデルにポジティブなフィードバックのみを提供するため、人気のバイアスにつながる可能性があります。この偏りは、人気分布の違いと事前知識の干渉に起因する可能性があります。つまり、ユーザーはより人気のあるアイテムをクリックする傾向があります。したがって、モデルは、関連性に関係なく、人気のあるアイテムを優先的に推奨する場合があります。
また、露出頻度に応じて製品をグループ化し、上図の右側の緑色の線で示されている人気分布の違いを分析しました。各グループの陽性サンプルの平均スコアを計算すると、すべてのサンプルが陽性サンプルであっても、平均スコアは曝露頻度とともに低下することが判明しました。レコメンデーション システム モデルをトレーニングする場合、人気度の分布とロングテールの分布には違いがあります。このモデルはアイテムの ID 特徴に人気度情報を注入する傾向があり、その結果、人気度の分布に違いが生じます。爆発性の高い製品によって得られるトレーニング回数は、ロングテールの製品よりもはるかに多く、爆発性の高い製品に対してモデルが過剰適合しており、ロングテールの製品では十分なトレーニングと合理的なベクトル表現を取得することが困難です。上図の右側の TSN チャートに示されているように、青い点は高曝露製品の積ベクトルを表し、赤い点はロングテール製品の積ベクトルを表しており、分布に大きな違いがあることがわかります。また、上図右側の赤線のように、露出回数が減るとヒット率も低下します。したがって、人気の偏りは、人気の分布の違いとロングテールの分布の違いによるものであると考えられます。
3. 人気バイアスに対する現在の解決策
現在の業界ソリューション 主に 2 つあります。タイプ、つまり逆傾向スコア (IPS) と因果推論です。
1. 逆傾向スコア (IPS)
一般的に言えば、メイン製品における暴露確率の高い商品の比重を下げることです。タスク損失関数は、曝露確率の高い製品に過度の注意を払わないようにすることで、陽性サンプル分布全体により均等に注意を払うことができます。ただし、この方法では暴露確率を事前に予測する必要があるため、不安定で失敗したり、大きく変動したりする可能性があります。
#2. 因果推論
i が製品特性を表し、u が表す因果図を構築する必要があります。ユーザーの特徴、c はクリック確率を表します。この図は、ユーザーの特徴と製品の特徴をモデルに入力してクリック率を予測することを示しています。 z で表される人気バイアスもこのモデルに取り入れると、クリックスルー率に影響を与えるだけでなく、製品 i の特徴表現にも影響を与えることになります。因果推論の方法は、次の影響をブロックしようとすることです。 i の z。
より簡単な方法は、製品の統計的特性を使用して別のバイアス タワーを取得することです。このとき、モデルは 2 つの点を出力します。 1 つは真のクリックスルー率、もう 1 つは製品の人気スコアです。オンライン予測を行う場合、人気の偏差を切り離すために製品の人気スコアは削除されます。
#2 番目の方法は、ユーザーのクリックを 2 つのカテゴリ (1 つは群衆の関心、もう 1 つは実際の関心) に分類し、それぞれサンプルの共同トレーニングを構築することです。これは 2 つのモデルを取得することに相当します。1 つはユーザーの集団関心スコアを取得するためのモデル、もう 1 つはユーザーの真の関心スコアを取得するためのモデルです。実は因果推論には問題があり、人気分布の違いは解決するが、ロングテール商品の学習データ不足の問題は解決できない。現在のソリューションは人気のバイアスを取り除く傾向がありますが、これは生き残るために「マシュー効果」を必要とするレコメンダー システムにとって必ずしも有益であるとは限りません。したがって、人気のあるアイテムは通常品質が高く、ユーザーには群集心理と本物の興味の両方があるため、レコメンデーション システムで人気のバイアスを完全に除去しないことをお勧めします。群れの利益。人気バイアスは合理的に利用されるべきであり、悪化させるべきではありません。
#4. CD2AN の基本フレームワーク
#人気バイアスを合理的に利用するには、人気分布の違いを考慮して、「偏りのない、完全に学習された商品表現をどのように抽出するか?」という課題を解決する必要があります。 、実際のコンテンツ ベクトルと人気ベクトルを製品 ID から切り離す必要があります。ロングテールの分布の違いに対処するために、ドメイン適応のパラダイムを利用して全体の分布を調整し、対照学習のパラダイムを利用してインスタンスの分布を調整します。
まずはベースモデルの基本構造をご紹介します ベースモデルは、実は古典的な2塔モデルです。次に、先ほど述べた2つの問題(人気分布の違いとロングテールの分布の違い)をどのように解決するかを詳しく紹介します。
#1. 機能分離モジュールにより、人気分布の違いが緩和されます
特徴分離モジュールは、レコメンデーション システムにおける人気度の偏りの問題を解決するために、この記事で提案されるソリューションです。このモジュールは、アイテム ベクトル表現の属性情報から人気情報を分離することにより、アイテム ベクトル表現に対する人気の影響を軽減します。具体的には、このモジュールには人気度エンコーダーと属性エンコーダーが含まれており、多層パーセプトロンの組み合わせを通じて各アイテムの属性と人気度ベクトル表現を学習します。このモジュールの入力は、上のモデル構造の右側に示すように、アイテム ID、アイテム カテゴリ、ブランドなどのアイテムの属性特性です。ここでは、アイテム属性情報から人気情報を分離することを目的として、直交正則化と人気類似性正則化を含む 2 つの制約があります。その中で、人気度の類似性正則化を通じて、モジュールはアイテム属性に埋め込まれた人気度情報を実際の人気度情報と一致させることが奨励され、一方、直交正則化を通じて、モジュールはエンコード内に異なる情報を保持するよう促され、それによって分離された人気度を達成します。情報とアイテムの属性情報。
上記のモデル構造の左側に示すように、真の人気を学習するためのモジュールも必要です。その入力は主に、次に、MLP を通過して、真の人気度の表現を取得します。
#2. 正則化により分布の違いが緩和される
##次に、ロングテール分布の差異の問題を解決したいと考えています。
私たちは転移学習のアイデアを利用して、人気製品とロングテール製品の分布の調整を実現します。元の 2 タワー モデルでは、未公開の製品を導入し、MMD 損失関数を使用しました (上図の左上に示すように)。図の右上の概略図に示すように、製品ドメインは可能な限り近くなります。この種のドメイン アライメントは監視されておらず、負の転移が生じる可能性があるため、次の最適化を行いました: ドメイン アライメント損失における露光サンプルの勾配は、タスク損失への影響を防ぐために停止されます。未露光サンプルの場合、細かいランク付けは次のとおりです。知識の蒸留。 私たちはまた、より良い製品ベクトル表現を学習するために、インスタンス アラインメントのアイデアも活用しています。主なアイデアは、製品の共起が効果的であればあるほど、ベクトル表現がより類似するということです。ここで難しいのは、ペアをどのように構築するかです。このようなペアは、ユーザーが過去の行動をとった製品シーケンスに自然に存在します。ユーザーを例にとると、サンプルにはユーザーの行動シーケンスと対象製品が含まれており、対象製品とユーザーの行動シーケンス内の各製品は共起ペアを形成できます。古典的な対比学習損失関数に基づいて、ユーザーの興味の多様性と製品の頻度も考慮します。特定の損失関数の式は、上図の左下部分に示されています。
上図の右下に示すように、灰色の点が対象製品、オレンジ色の点がユーザーの行動シーケンス、青の点が負の値を示す直感的な図を見ることができます。ランダムなネガティブサンプリングによって取得されたサンプル。私たちは、ユーザーの行動シーケンス内の各製品をターゲット製品に近づけるために、対照的な学習方法から学んでいきたいと考えています。3. 偏りのある共同トレーニングと偏りのない共同トレーニング
4、オフラインおよびオンライン実験
##上の図は、このモデルのオフラインとオンラインの効果を示しています。オフライン実験では、リコール結果の中でどれだけの項目が高曝露項目であるかを測定するために C-Ratio 指標を導入しました。オフライン実験を通じて、各モジュールがある程度貢献していることがわかります。不偏モデルではオンライン効率指標が向上せず、人気情報が有用であることが示されており、人気情報を活用するには依然として偏りモデルを使用する必要があります。
#最後に、モデルの結果を視覚的に表示しました。私たちは、新しいモデル構造が爆発性の高い製品とロングテール製品の分布を実際に調整できることを発見しました。分離された人気表現ベクトルと製品の偏りのないコンテンツ表現にはほとんど交差がなく、同じ目的の製品はより近いものになる可能性があります。 α を調整することで、モデルはユーザーの集団的関心と実際の関心に方向性を合わせて適合させることができます。
本日共有される論文のタイトルは、「レコメンダーの人気バイアスを活用するための、解き放たれたドメイン適応ネットワークの共同トレーニング」です。 #5. Q&A セッション
#Q1: 未露光サンプルはどのようにしてサンプルに追加されますか?
A1: オフラインで生成されます。1 つのサンプルについて、ターゲットの陽性サンプルと対応するカテゴリを取得し、次にランダムにいくつかのサンプルをサンプリングし、オフラインでターゲットの陽性サンプルを取得できます。トレーニングサンプルには同じカテゴリが付けられます。
#Q2: 同じ種類の未露光サンプルを導入すると、学習の難易度が上がりますか?
A2: 導入された未露光サンプルにはラベルがなく、監視されていない方法で配布されています。負の転写がある可能性があります。この問題を解決するために 2 つの手法を使用しました。タスク損失への影響を防ぐためにドメイン アライメント損失が停止されます。未公開のサンプルについては、知識の蒸留のために詳細なランキングを導入できます。
Q3: 未露光サンプルの詳細なランキングスコアを取得するには非常に費用がかかりますか?
#A3: ファイン ランキング モデルを使用してオフラインでサンプルをスコアリングし、特徴として使用します。パフォーマンスは悪くありません。
#Q4: 未露光サンプルはリファインされる未露光サンプルですか?
#A4: いいえ、これは依然として高性能爆発性製品である可能性が高く、同じグローバル カテゴリの下でランダム サンプリングの結果を使用しています。
以上が正確なレコメンデーションの秘密: アリババの分離ドメイン適応不偏リコール モデルの詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









Go 言語と Redis を使用してレコメンデーション システムを実装する方法レコメンデーション システムは、最新のインターネット プラットフォームの重要な部分であり、ユーザーが興味のある情報を発見して入手するのに役立ちます。 Go 言語と Redis は、レコメンデーション システムの実装プロセスで重要な役割を果たす 2 つの非常に人気のあるツールです。この記事では、Go 言語と Redis を使用して簡単なレコメンデーション システムを実装する方法と、具体的なコード例を紹介します。 Redis は、キーと値のペアのストレージ インターフェイスを提供し、さまざまなデータをサポートするオープンソースのインメモリ データベースです。

インターネット技術の継続的な発展と普及に伴い、重要な情報フィルタリング技術としてレコメンドシステムがますます広く利用され、注目されています。レコメンデーション システム アルゴリズムの実装に関しては、高速で信頼性の高いプログラミング言語として Java が広く使用されています。この記事では、Java で実装されたレコメンデーション システム アルゴリズムとアプリケーションを紹介し、ユーザー ベースの協調フィルタリング アルゴリズム、アイテム ベースの協調フィルタリング アルゴリズム、およびコンテンツ ベースのレコメンデーション アルゴリズムという 3 つの一般的なレコメンデーション システム アルゴリズムに焦点を当てます。ユーザーベースの協調フィルタリングアルゴリズムは、ユーザーベースの協調フィルタリングに基づいています

インターネット アプリケーションの人気に伴い、マイクロサービス アーキテクチャが一般的なアーキテクチャ手法になりました。その中でも、マイクロサービス アーキテクチャの鍵となるのは、アプリケーションを異なるサービスに分割し、RPC で通信することで疎結合なサービス アーキテクチャを実現することです。この記事では、実際の事例をもとに、go-microを使ってマイクロサービスレコメンドシステムを構築する方法を紹介します。 1. マイクロサービス レコメンデーション システムとは何ですか? マイクロサービス レコメンデーション システムは、マイクロサービス アーキテクチャに基づいたレコメンデーション システムであり、レコメンデーション システム内のさまざまなモジュール (特徴量エンジニアリング、分類など) を統合します。

1. シナリオの紹介 まず、今回のシナリオである「良い商品が手に入る」シナリオを紹介します。その場所はタオバオのホームページ上の 4 つの正方形のグリッド内にあり、1 ホップの選択ページと 2 ホップの承認ページに分かれています。受付ページには主に 2 つの形式があり、1 つは画像とテキストの受付ページ、もう 1 つは短いビデオの受付ページです。このシナリオの主な目標は、ユーザーに満足のいく商品を提供し、GMV の成長を促進し、それによって専門家の供給をさらに活用することです。 2. 人気バイアスとは何ですか。なぜ次に、この記事の焦点である人気バイアスについて説明します。人気バイアスとは何ですか?人気の偏りはなぜ起こるのでしょうか? 1. 人気バイアスとは 人気バイアスには、マシュー効果や情報コクーンルームなどの別名があり、直感的に言えば爆発性の高い製品のカーニバルであり、人気のある製品ほど露出されやすくなります。この結果、

クラウド コンピューティング技術の継続的な開発と普及に伴い、クラウド検索および推奨システムの人気が高まっています。この需要に応えて、Go 言語も優れたソリューションを提供します。 Go 言語では、高速な同時処理機能と豊富な標準ライブラリを使用して、効率的なクラウド検索およびレコメンデーション システムを実装できます。以下では、Go 言語がこのようなシステムをどのように実装しているかを紹介します。 1. クラウド上の検索 まず、検索の姿勢と原則を理解する必要があります。検索姿勢とは、ユーザーが入力したキーワードに基づいてページを検索エンジンが照合することを指します。

1. 問題の背景: コールド スタート モデリングの必要性と重要性 コンテンツ プラットフォームとして、Cloud Music には毎日大量の新しいコンテンツがオンラインにあります。クラウド音楽プラットフォーム上の新しいコンテンツの量は、ショートビデオなどの他のプラットフォームに比べて比較的少ないですが、実際の量は皆の想像をはるかに超えている可能性があります。同時に、音楽コンテンツは、短いビデオ、ニュース、製品の推奨とは大きく異なります。音楽のライフサイクルは非常に長期間に及び、多くの場合、数年単位で測定されます。曲によっては数か月、数年眠っていた後に爆発することもありますし、名曲は10年以上経ってもなお強い生命力を持っていることもあります。したがって、音楽プラットフォームのレコメンドシステムでは、他のカテゴリをレコメンドすることよりも、人気のないロングテールの高品質コンテンツを発見し、適切なユーザーにレコメンドすることが重要です。

1. 因果関係修正の背景 1. レコメンデーションシステムにズレが生じる レコメンドモデルは、データを収集して学習し、ユーザーに適切なアイテムをレコメンドします。ユーザーが推奨アイテムを操作すると、収集されたデータはモデルをさらにトレーニングするために使用され、閉ループが形成されます。ただし、この閉ループにはさまざまな影響要因が存在し、エラーが発生する可能性があります。エラーの主な理由は、モデルのトレーニングに使用されるデータのほとんどが理想的なトレーニング データではなく観測データであり、露出戦略やユーザーの選択などの要因の影響を受けることです。このバイアスの本質は、経験的なリスク推定値の期待値と真の理想的なリスク推定値の期待値の違いにあります。 2. 一般的なバイアス レコメンデーション マーケティング システムにおける一般的なバイアスには、主に 3 つのタイプがあります: 選択的バイアス: ユーザーのルートに起因します。

インターネットの急速な発展に伴い、推奨システムはますます重要になってきています。レコメンデーション システムは、ユーザーが興味のあるアイテムを予測するために使用されるアルゴリズムです。インターネット アプリケーションでは、推奨システムがパーソナライズされた提案や推奨を提供できるため、ユーザーの満足度とコンバージョン率が向上します。 PHP は、Web 開発で広く使用されているプログラミング言語です。この記事では、PHP のレコメンデーション システムと協調フィルタリング テクノロジについて説明します。レコメンデーション システムの原理 レコメンデーション システムは、機械学習アルゴリズムとデータ分析に依存しており、ユーザーの過去の行動を分析および予測します。
