まず、Kuaishou のコールド スタートが解決する問題を見てみましょう。解決を開始します。
短期的には、プラットフォームはまず、より多くの新しい動画でトラフィックを獲得できるようにする、つまり動画を配信できるようにする必要があります。同時に、送信トラフィックの効率も向上する必要があります。長期的には、より多くの可能性を秘めた新しい動画を探索して発掘し、人気層全体により多くの新鮮な血液を提供し、生態学的マシュー効果を緩和する予定です。より高品質のコンテンツを提供し、ユーザー エクスペリエンスを向上させ、継続時間と DAU も増加します。
コールド スタートを使用して、UGC 作成者を促進し、プロデューサー全体の維持を維持するためのインタラクティブなフィードバック インセンティブを獲得します。このプロセスには 2 つの制約があります。まず、全体的な探査コストと交通コストは、大局的には比較的安定しているはずです。 2 番目に、新しいビデオの配信には vv が低い段階でのみ介入します。では、これらの制約の下で、全体的な利益を最大化するにはどうすればよいでしょうか?
動画のコールド スタート配信は、特にその作品がその内容に適合しない人々に配信される場合、その成長領域に重要な影響を及ぼします。これには 2 つの影響があります。まず第一に、著者の成長に影響があり、長期的には効果的なインタラクティブトラフィックインセンティブを受け取ることができなくなり、投稿の方向性や投稿意欲の変化につながります。第二に、初期のトラフィックでは有効なコンバージョン率が欠如しているため、システムはコンテンツの品質が低いとみなしてしまうため、長期的には成長を達成するのに十分なトラフィック サポートを得ることができなくなります。
このままでは生態系はかなり悪い状態に陥ってしまいます。たとえば、地元の食べ物に関する作品がある場合、その作品には最適な視聴者グループ A が必要であり、全体的なアクション率が最も高くなります。さらに、まったく関係のないグループ C が存在する可能性があります。このグループに投票すると、ある程度の選択性が生じ、アクション率が非常に低くなる可能性があります。もちろん、3 番目のグループ B もあり、これは非常に幅広い関心を持つグループで、このグループの人の流れは大きいですが、このグループの全体的な行動率は低くなります。コア グループ A にできるだけ早く到達して、コンテンツの初期インタラクション率を高めることができれば、自然なトラフィックの分散を活用することができます。しかし、初期段階で群集 C または群集 B にトラフィックを与えすぎると、全体的なアクション率が低下し、その成長が制限されてしまいます。全体として、コールド スタート配信の効率を向上させることが、コンテンツの成長を達成するための最も重要な方法です。コンテンツのコールド スタート効率の反復を完了するために、いくつかの中間プロセス指標と最終的な長期指標を確立します。
#書き換えられた内容: プロセス指標は主に 2 つの部分に分かれており、1 つは新しい動画の消費パフォーマンス (主にトラフィックを含む)他の部分は、探査指向、利用指向、生態指向などのオフスロープ指標です。調査の方向性は、高品質の新しいビデオが無視されないようにすることであり、主に露出が 0 を超えるビデオと露出が 100 を超えるビデオの数の増加を観察します。 Xiangxiang を使用して、人気のある高 VV ビデオや高品質の新しいビデオの数の増加を観察します。エコロジカルな方向では、主に人気のあるプールのユーザー普及率を観察します。長期的には、これは生態学的影響によってもたらされる長期的な変化であるため、最終的にはコンボ実験を使用して、APP期間、著者DAU、全体的なDAUなど、いくつかの主要な指標の長期的な変化傾向を観察する予定です
2. コールド スタート モデリングの課題と解決策
一般的に、内容が冷たい 起動には主に 3 つの困難があります。まず、コンテンツのコールド スタートのサンプル空間と実際のソリューション空間の間には大きな違いがあります。第 2 に、コンテンツのコールド スタートのサンプルは非常にまばらであるため、不正確な学習結果と非常に大きな偏差が生じ、特に露出バイアスの点で不利になります。第三に、動画の成長価値をモデル化することも困難であり、これは私たちが現在解決に向けて懸命に取り組んでいる問題でもあります。この記事では、最初の 2 つの側面における困難に焦点を当てます
コンテンツのコールド スタート問題を最適化する場合、サンプル空間は解空間よりも小さいため、スペースは非常に重要な問題です。特におすすめコンテンツのコールドスタートに関しては、より多くの動画が表示される機会を得るために、インデックスされたコンテンツのリーチ率を高める必要があります。
# この問題を解決するには、インデックスされたコンテンツのリーチ率を高める必要があると考えています。 、最も重要なことは、リコール段階でビデオのリーチと露出効率を向上させることです。コールドスタートビデオのリコール到達率を解決するため。業界の一般的なアプローチは、属性の反転、意味の類似性に基づくいくつかの想起方法、ツインタワーと一般化機能に基づく想起モデル、または動作空間とコンテンツ空間の間のマッピングの導入など、コンテンツベースに基づいています。 ~ CB2CF のアプローチに基づく。
#今回は、グラフ エントロピーに基づく、さらに興味深い 2 つの新しい手法に焦点を当てます。異種グラフ ネットワークと I2U ベースの銀河モデル。テクノロジーの選択に関しては、まずコンテンツ コールド スタート U2I のベース モデルとして GNN を使用します。 GNN は全体として帰納的学習手法であると考えられているため、新しいノードに非常に親しみやすく、より高い柔軟性を提供します。さらに、GNN では、コールド スタートのコンテンツ アクセスを強化する重要な手段である属性ノードがさらに導入されています。具体的な実践としては、userノード、authorノード、itemノードも導入し、情報の集約を完了させます。この一般化された属性ノードの導入後、新しいコンテンツの全体的な到達率が大幅に向上しました。ただし、タグ カテゴリなどの中間ノードが一般的すぎると、ビデオの知覚領域が不十分にパーソナライズされ、過剰な平滑化のリスクが生じます。事例レビューから、バドミントンのビデオを見ることを好む一部のユーザーにとって、既存の GNN 特性評価スキームでは、バドミントンのビデオと他の卓球、サッカー、その他のビデオとの区別が不十分になる可能性があることがわかりました。
GNN モデリング プロセスにあまりにも多くの一般化情報を導入することによって引き起こされる過剰一般化問題を解決するために、私たちの主なアイデアは、より多くの一般化情報を導入することです。詳細 提案された近隣特徴付けスキームに基づいて、セマンティック自己強化エッジが GNN に導入されます。右下の図からわかるように、人気のないビデオを使用して、人気のあるスペースで類似の人気のビデオを検索し、その人気のある類似のビデオをコールド スタート接続の最初のノードとして使用します。具体的な集計プロセスでは、グラフ エントロピー削減の原理に基づいて自己強化エッジを構築および選択します。具体的な選択計画は、主に接続された隣接ノードの上記の説明と現在のノード情報を考慮した式からわかります。 2 つのノード間の類似性が高い場合、それらの情報エントロピーは小さくなります。以下のノードの分母は、隣接ノードの全体的な知覚ドメインを表します。また、選択プロセスでは、より強力な知覚を持つ隣接ノードを見つけることを好むことも理解できます。このプロセスでは、主に 2 つのテクニックがあり、1 つは、類似した動画の特徴ドメインとアイテム ID の特徴ドメインが埋め込みスペースを共有する必要があり、その後、自己強化ノードは人気のある動画のみを保持して、不十分な学習によって導入されたノイズを除去します。ノード。このアップグレードにより、全体的な一般化が完全に保証され、モデルのパーソナライゼーションの程度が効果的に向上し、オフラインおよびオンライン効果の向上がもたらされます。
#上記の方法は実際には、U2I の観点からコンテンツ リーチのモデリングを改善するものですが、ビデオが到達できないという問題を根本的に解決することはできません
考え方を変えて、アイテムの観点から適切な人材を探す、つまり I2U の観点に切り替えると、理論的にはすべての動画にトラフィックを獲得する余地があることになります。
具体的なアプローチとしては、I2U 検索サービスをトレーニングし、この検索サービスを使用して各ビデオの関心のあるグループを動的に取得する必要があります。この I2U 合成方法を通じて、U2I 転置インデックスが逆に構築され、最終的にユーザーのリアルタイム要求に従って項目リストがコールド スタート推奨リストとして返されます。 書き直された内容は次のとおりです: I2U 取得サービスのトレーニングに焦点を当てています。最初のバージョンは 2 タワー モデルです。実際には、ユーザーの過度の集中の問題を回避するために、最初に uid を放棄し、アクション リストとセルフ アテンションを使用して、ユーザーの集中の問題を効果的に軽減します。同時に、学習プロセス中に item-id によって引き起こされる学習露出バイアスを回避するために、item-id を廃止し、アイテム ID を効果的に軽減するために、セマンティック ベクトル、カテゴリ、タグ、AuthorID などのより一般化された機能を導入します。 id. - ID の集約。ユーザーの観点から見ると、この種の Debias 損失が導入され、ユーザーの集中の問題をより適切に回避するためにバッチ内のネガティブ サンプリングが導入されます。 #最初の実習はツインタワーI2Uモデルでしたが、実習中にいくつかの問題点も見つかりました。まず第一に、2 タワー モデルにはユーザーとアイテム間のインタラクションに制限があり、全体的な検索精度には限界があります。また、興味の集中の問題もあり、ユーザーに実装されるコンテンツは興味が非常に集中していることが多いですが、実際にはユーザーの興味は多峰的に分散しています。また、ユーザーが集中しすぎているという問題も見つかりました。コールド スタート ビデオのほとんどは、一部のトップ ユーザーにマウントされています。結局、トップ ユーザーが毎日視聴できるコンテンツも限られているため、これは合理的ではありません #上記の 3 つの問題を解決するための新しい解決策は、TDM モデリングと TDM 階層検索手法です。 TDM の利点の 1 つは、より複雑なユーザーとアイテムのインタラクション モードを導入し、ツイン タワーのインタラクション制限を突破できることです。 2 つ目は、単峰性関心への依存を減らす DIN のようなパターンを使用することです。最後に、TDM での階層検索の導入により、ユーザーの集中が高まる問題を非常に効果的に軽減できます。
さらに、より効果的な最適化ポイントがあります。それは、子孫ノードの集合表現を親ノードに追加することです。これにより、親ノードの特徴の一般化と識別の精度を向上させることができます。つまり、アテンション メカニズムを通じて子ノードを親ノードに集約し、レイヤーごとの転送を通じて、中間ノードにも特定の意味論的一般化機能を持たせることができます 具体的な方法は、現在の業界の方法の一部と似ていますが、U2U拡張モジュールには主に 3 つの利点があります。まず、TDM ツリー構造は比較的しっかりしており、この U2U モジュールを追加すると、ユーザーのリアルタイムの好みに近づけることができます。第二に、リアルタイムの興味の広がりを通じて、モデルの限界を突破し、ユーザーのコラボレーションを通じてコンテンツを迅速に宣伝することができ、多様性の向上をもたらします。最終的に、これにより Galaxy リコールの全体的な範囲も改善できます。これらは、実践プロセスにおける最適化ポイントの一部です
これらのソリューションを通じて、私たちは、コンテンツのコールド スタートにおけるサンプル空間と実際の解空間の間の不一致の問題を効果的に解決できるため、コールド スタートの到達範囲とカバレッジ効果が大幅に向上します。 2. 不正確なコールド スタートサンプルの疎な学習と大きな偏差
次に、コールド スタートのサンプルの疎性が不正確な学習と大きな偏差を引き起こすという、最大の課題である問題を紹介します。この問題の本質はインタラクション動作の希薄性であり、この問題を 3 つの方向に拡張します。 まず第一に、コールド スタート サンプルの露出が低いため、アイテム ID の学習が不十分であり、これがレコメンド効果とレコメンド効率に影響を与えます。第 2 に、初期の分布の不正確さにより、収集されたラベルの不確実性が高く、信頼性が低くなります。第三に、現在のトレーニング パラダイムでは、補正なしでアイテムの埋め込みに人気情報が導入されるため、コールド スタート ビデオが過小評価され、完全に配信できなくなります。四方向。 1 つ目は一般化、2 つ目は移転、3 つ目は探索、4 つ目は修正です。一般化とは、一般化された機能の観点からモデリングとアップグレードを完了することです。移行の主な目的は、人気のないビデオと人気のあるビデオを 2 つのドメインとして捉え、人気のあるビデオ ドメインまたは完全な情報ドメインから情報を効果的に転送して、人気のないビデオの学習を支援することです。探索では、主に探索と利用のアイデアを導入します。つまり、初期のラベルが不正確な場合、モデル化プロセスに探索のアイデアを導入し、それによって寒い時期のラベルの不信による悪影響を軽減したいと考えています。スタートステージ。人気度補正は現在流行中ですが、主にゲーティングや定期的な損失による人気度情報の利用制限を行っております。 以下は私たちの仕事の詳細な紹介です。 #まず第一に、一般化は、コールド スタートの問題を解決するときに非常に一般的な方法です。ただし、実際には、ラベルやカテゴリと比較して、いくつかの意味論的な埋め込みを導入することも非常に有用であることがわかります。ただし、セマンティック機能をモデル全体に直接追加する利点は限られています。ビデオ意味空間と動作空間の間には違いがあるため、一般化を支援するビデオ意味空間の共通情報を通じて動作空間における新しいビデオの位置を近似的に表すことができるでしょうか。前に、一般化情報を実際の動作空間にマッピングすることを学習する CB2CF などのいくつかのメソッドについて説明しました。ただし、このアプローチに従う代わりに、ビデオの意味ベクトルに基づいて、ターゲット アイテムに類似したアイテムのリストを見つけます。まず、ユーザーの長期および短期の関心行動と行動空間を共有し、類似アイテムのリストを集約して、行動空間における候補ビデオの表現をシミュレートします。実際、この方法は、以前に説明したグラフ再現の候補に類似したエッジを導入する方法に似ており、その効果は非常に明白で、オフライン AUC が 0.35PP 増加します。 #以下は、デュアル ドメイン転移学習フレームワークです。全体的な考え方は、コールドスタート コンテンツは多くの場合、非常に偏ったロングテール配信であり、人気バイアスの影響を受けやすいグループでもあるということです。コールド スタート サンプルのみを使用すると、人気の偏りはある程度軽減できますが、ユーザーの関心が大幅に失われ、全体的な精度が低下します。
私たちの現在の試みのほとんどは、ホット サンプルのアンダーサンプリング、または逆周波数重み付けまたは汎化機能を介したコールド スタート サンプルの学習に焦点を当てていますが、コールド スタート間の動作空間には固有の共通点が存在します。 - 初期の行動サンプルや人気のあるビデオを開始すると、見落とされることがよくあります。 そこで、設計プロセス中に、フル サンプルとコールド スタート サンプルを 2 つのドメイン (上図のフル ボリューム ドメインとコールド スタート ドメイン) に分割します。すべてのサンプル、およびコールド スタート ドメイン これはコールド スタート条件下のサンプルに対してのみ有効であり、双方向のホットおよびコールド ナレッジ ドメインの移行モジュールが追加されます。具体的には、ユーザーとアイテムが個別にモデル化され、グローバル サンプル タワーからコールド スタート サンプル タワーへのネットワーク マッピングが実行されるため、モデル レベルで暗黙的なデータ拡張がキャプチャされ、コールド スタート ビデオの表現が向上します。アイテム側では、すべてのコールド スタート サンプルを保持します。さらに、ホット ドメインとコールド ドメインの分布の類似性を確保するために、露出に基づいていくつかのホット ビデオもサンプリングし、最終的にはマッピング全体のスムーズな知識の伝達を保証します。 さらに、独自の二重人気ゲーティング メカニズムを追加し、いくつかの人気機能を導入し、それをホット ビデオ ドメインとコールド ビデオ ドメインの融合比率を支援するために使用しました。一方で、さまざまなライフサイクルにおける新しいビデオのコールド スタート式の利用率を効果的に学習し、配信することができます。一方、ユーザー側は、ビデオのコールド スタートに対するさまざまなアクティブ ユーザーの感度も学習します。実際に、オフライン効果は、低 vv 段階および 4000vv の AUC の両方である程度改善されました。 最後に修正作業である熱補正を紹介します。レコメンデーション システムは人気の偏りに直面することが多く、一般に爆発性の高い製品のお祭り状態です。既存のモデル パラダイム フィッティングの目標はグローバル CTR です。人気のあるアイテムを推奨すると、全体的な損失が少なくなる可能性がありますが、アイテムの埋め込みに人気のある情報が注入されるため、人気の高い動画が過大評価されることになります。 既存の手法の中には不偏推定を追求しすぎるものもありますが、実際には消費損失が発生します。そこで、一部のアイテムの埋め込みを人気情報や実際の関心情報から切り離し、人気情報と関心情報をオンライン融合に効果的に利用できないでしょうか? これは、より合理的な方法かもしれません。具体的な実践では、他社の実践を参考にしました。 主に 2 つのモジュールに焦点を当てます。1 つは、人気と関心を入力することです。コンテンツの直交制約 (アイテム ID や作成者 ID などの特徴の入力など) は 2 つの表現を生成します。これら 2 つの表現のうち 1 つは人気の表現で、もう 1 つは真の関心の表現です。通常の制約は、解決プロセス中に作成されます。 。 2 つ目は、いくつかのアイテムの純粋な熱情報の埋め込みをビデオの純粋な熱表現として生成することです。純粋な熱の表現は、ビデオの実際の熱の表現に基づいて類似性制約を作成します。先ほどの熱量表現と興味度表現を取得し、一方は人気情報を表現し、もう一方は興味情報を表現します。最後に、これら 2 つの表現に基づいて、乗算公式融合のために偏りのある推定と不偏の推定のキューがオンラインで追加されます。 最後に、今後の仕事の展望についてお話しさせていただきます。 まず第一に、同様の群衆の現在の拡散を含め、特にリアルタイムで、群衆拡散モデルをより正確にモデル化して適用する必要があります。 U2U の拡散アプリケーションなど、コールド スタート段階で同様のクラウド拡散計画をいくつか実施しましたが、その改良レベルをさらに向上させたいと考えています 2 つ目は修正計画です。 . 現在の因果モデルには、コールド スタート補正に関する多くの研究も含まれています。特に露出補正と熱補正に関して、この方向で継続的な研究と探索も行っていきます。3 つ目はサンプルの選択です。高熱のサンプルはまだコールド スタートの推奨事項のより大きな価値: 高熱サンプル空間でより価値のあるサンプルをいくつか選択し、それらに異なる重みを与えて、コールド スタート モデルの推奨効率を向上させることはできますか。 3 番目は、動画の長期的な成長価値の特徴付けです。各動画は、コールド スタート、成長、安定性、衰退のプロセスを経る必要があります。ビデオをモデリングする際には、より多くの注意を払う必要があります。その長期的な利点、つまり、特に価値の活用という点での成長余地、将来の成長に関して、異なる単一の分布の価値の違いをどのようにモデル化するかということも、非常に興味深い課題です。 最後は、データ強化によるソリューションです。サンプルであれ、比較学習ソリューションであれ、コールド スタートの推奨の効率を向上させるために、この分野での取り組みを導入したいと考えています。 。 A1: I2U モデルは、オフライン プロセス中にインデックス ライブラリで最も類似したユーザーを継続的に検索し、見つかった最も類似したユーザーとアイテムに基づいてユーザーをユーザーに変換します。項目のペア、そして最後に項目リストのユーザーの集計結果を取得し、それをオンラインで使用するために Redis に保存します。 A2: 共有の中でいくつかの方法が挙げられていますが、基本的にはやはり一般化、探索、修正の観点から解決しています。たとえば、より適切な初期点を持つように項目 ID を初期化し、同時にいくつかの一般化された特徴を導入して一般化された特徴を行動意味論的空間にマッピングする方法。次に、ベータ配布を使用して探索性を向上させ、純粋なコンテンツ タワーを導入して pid などの強力なメモリを持つ機能を削除し、それによって熱バイアスのない純粋な汎化推定と修正作業を導入し、学習の向上を目指します。個別に制約され、純粋な関心基準と人気基準が提供され、人気基準の使用強度はオンラインで合理的に分散されます。もちろん、これらの手法に加えて、データ強化によってコールドスタート コンテンツの希薄性を緩和したり、人気のあるコンテンツを使用して転移学習の観点からコールド スタート コンテンツの学習を支援したりすることも試みています。 A3: 最適化率は、実際には手作業の関与が非常に高いタスクであるため、モデルを完全に使用してビデオの最適化率を評価することは不可能です。 50,000 インプレッションを持つ動画などのコンテンツを評価するためにモデルを使用できる場合、全体的な優れた率は手動で参加することになり、どれが優れているかをレビューするレビュアーに確実に押し付けられることになります。 3. 今後の展望
4. 質疑応答セッション
Q1: オンライン リクエストはすべてユーザー単位で行われますが、I2U のユーザーはどのようにしてオンラインのベクトル エンジンに入れられますか?
Q2: コールド スタートのもう 1 つの側面は、ヘッダー コンテンツの漏洩を防ぐ方法です。過熱によりサンプルの割合が高すぎて、ますます集中的なプッシュが発生します。何か方法はありますか?
#Q3: 人気のあるプールの最適なレートはどのように計算されますか?
以上がKuaishouコンテンツのコールドスタート推奨モデルの実用化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。