


Le secret d'une recommandation précise : explication détaillée du modèle de rappel impartial d'adaptation de domaine découplé d'Alibaba
1. Introduction à la scène
Tout d'abord, présentons le scénario impliqué dans cet article - le scénario « de bons produits sont disponibles ». Son emplacement se trouve dans la grille à quatre carrés de la page d'accueil de Taobao, qui est divisée en une page de sélection à un saut et une page d'acceptation à deux sauts. Il existe deux formes principales de pages d'hébergement, l'une est une page d'hébergement de graphiques et de textes, et l'autre est une courte page d'hébergement de vidéos. L’objectif de ce scénario est principalement de fournir aux utilisateurs des biens satisfaisants et de stimuler la croissance du GMV, exploitant ainsi davantage l’offre d’experts.
2. Qu'est-ce que le biais de popularité et pourquoi
Continuer Allons Venons-en au sujet de cet article, le biais de popularité. Qu’est-ce que le biais de popularité ? Pourquoi un biais de popularité se produit-il ?
1. Quel est le biais de popularité #
L'écart de popularité a de nombreux alias , comme
Effet Matthew, salle cocon d'information, Intuitivement parlant, c'est un produit hautement explosif Carnaval, plus le produit est populaire, plus il est facile d'être exposé. Cela se traduira par des produits à longue traîne de haute qualité ou de nouveaux produits créés par des experts n'ayant pas la chance d'être exposés. Il y a deux inconvénients principaux. Le premier point est le manque de personnalisation des utilisateurs. Le deuxième point est que les nouveaux produits créés par les experts ne reçoivent pas suffisamment de visibilité, ce qui réduit le sentiment de participation des experts. le biais de popularité.
Comme le montre le graphique à barres bleues sur le côté droit de l'image ci-dessus, les 10 % de produits les plus exposés représentaient pour 63% du total sur un certain jour d'exposition, ce qui prouve que l'effet Matthew est très grave lorsqu'il y a de bons produits.
2. Pourquoi le biais de popularité se produit-il
Suivant ? Nous attribuons la raison pour laquelle le biais de popularité se produit. Tout d’abord, nous devons clarifier pourquoi nous effectuons le travail d’atténuation des biais de popularité dans la troncature des rappels. Le modèle de classement correspond au CTR du produit et ses échantillons de formation incluent des échantillons positifs et des échantillons négatifs. Les produits avec un CTR plus élevé sont plus susceptibles d'être exposés. Mais au stade du rappel, nous utilisons généralement le modèle à deux tours. Ses échantillons négatifs sont généralement générés de deux manières. La première est un échantillonnage négatif aléatoire global et la seconde est un échantillonnage négatif intra-lot. Idem Un lot prend d'autres journaux d'exposition d'échantillons positifs comme échantillons négatifs, il peut donc atténuer l'effet Matthew dans une certaine mesure. Cependant, grâce à des expériences, nous avons constaté que l'effet réel sur l'efficacité en ligne de l'échantillonnage négatif global serait meilleur. Cependant, l’échantillonnage négatif aléatoire global dans les systèmes de recommandation peut conduire à un biais de popularité car il ne fournit qu’un retour positif au modèle. Ce biais peut être attribué aux différences de répartition de la popularité et à l’interférence des connaissances antérieures, c’est-à-dire que les utilisateurs ont tendance à cliquer sur des éléments plus populaires. Par conséquent, le modèle peut recommander préférentiellement des articles populaires, quelle que soit leur pertinence. Nous avons également analysé les différences dans la répartition de la popularité, comme le montre la ligne verte à droite de la figure ci-dessus. En regroupant les éléments en fonction de la fréquence d'exposition et en calculant le score moyen des échantillons positifs pour chaque groupe, nous avons constaté que même si tous les échantillons sont des échantillons positifs, le score moyen diminue avec la diminution de la fréquence d'exposition. Il existe des différences dans la distribution de popularité et la distribution à longue traîne lors de la formation des modèles de système de recommandation. Le modèle aura tendance à injecter des informations de popularité dans les caractéristiques d’identification des éléments, ce qui entraînera des différences dans la répartition de la popularité. Le nombre de temps de formation obtenus par les produits hautement explosifs est beaucoup plus grand que celui des produits à longue traîne, ce qui rend le modèle sur-ajusté pour les produits hautement explosifs, et il est difficile pour les produits à longue traîne d'obtenir une formation suffisante et un vecteur raisonnable. représentation. Comme le montre le graphique TSN sur le côté droit de la figure ci-dessus, les points bleus représentent les vecteurs de produits des produits à forte exposition, tandis que les points rouges représentent les vecteurs de produits des produits à longue traîne, montrant une différence significative dans la distribution. Et comme le montre la ligne rouge sur le côté droit de la figure ci-dessus, le taux de réussite diminuera également à mesure que le nombre d'expositions diminuera. Par conséquent, nous attribuons le biais de popularité à la différence de distribution de popularité et à la différence de distribution à longue traîne.3. Solutions actuelles au biais de popularité
Les solutions actuelles de l'industrie comprennent principalement deux types, à savoir le score de propension inverse (IPS) et l'inférence causale.
1. Score de propension inverse (IPS)
En termes simples, cela signifie réduire le poids des produits à forte probabilité d'exposition dans la fonction de perte de tâche principale pour éviter une concentration excessive sur les produits à forte probabilité d'exposition, donc que l'ensemble du produit peut faire l'objet d'une attention plus égale à la distribution positive des échantillons. Cependant, cette méthode nécessite de prédire à l’avance la probabilité d’exposition, qui est instable et sujette à des défaillances ou à de grandes fluctuations.
2. Inférence causale
Nous devons construire un diagramme causal, où i représente les caractéristiques du produit, u représente les caractéristiques de l'utilisateur et c représente la probabilité de clic. Ce diagramme représente la saisie des caractéristiques de l'utilisateur et des caractéristiques du produit dans le. modèle , prédisez le taux de clics. Si nous prenons également en compte le biais de popularité dans ce modèle, représenté par z, cela affectera non seulement le taux de clics, mais également la représentation des caractéristiques du produit i. La méthode d'inférence causale consiste à essayer de bloquer l'impact de. z sur je.
La méthode la plus simple consiste à utiliser certaines caractéristiques statistiques du produit pour obtenir une tour de biais distincte. À ce stade, le modèle produira deux scores, l'un est le taux de clics réel et l'autre est le taux de clics réel. score de popularité du produit, en ligne Lors de la prévision, le score de popularité du produit sera supprimé pour obtenir un découplage de l'écart de popularité.
La deuxième méthode consiste à attribuer les clics des utilisateurs en deux catégories, l'une est l'intérêt collectif et l'autre l'intérêt réel, et à construire respectivement une formation conjointe des échantillons. Cela équivaut à obtenir deux modèles, un modèle pour obtenir le score d'intérêt du troupeau de l'utilisateur et un modèle pour obtenir le véritable score d'intérêt de l'utilisateur. L'inférence causale pose en fait des problèmes. Elle résout la différence de répartition de la popularité, mais elle ne peut pas résoudre le problème du manque de données de formation pour les produits à longue traîne. Les solutions actuelles tendent à éliminer les biais de popularité, mais cela n'est pas toujours bénéfique pour les systèmes de recommandation qui ont besoin de « l'effet Matthew » pour survivre. Par conséquent, nous recommandons de ne pas supprimer complètement le biais de popularité dans le système de recommandation, car les articles populaires sont généralement de meilleure qualité et les utilisateurs ont également à la fois une mentalité de troupeau et un réel intérêt. La suppression complète du biais de popularité affectera la satisfaction des utilisateurs. intérêts du troupeau. Le biais de popularité doit être utilisé de manière rationnelle sans l’exacerber.
4. Cadre de base du CD2AN
Le travail que nous explorons cette fois est de savoir comment utiliser rationnellement le biais de popularité. Pour utiliser raisonnablement le biais de popularité, nous devons résoudre une difficulté : " Comment extraire une représentation impartiale et entièrement apprise du produit ? " Pour remédier aux différences de répartition de la popularité, nous devons dissocier le vecteur de contenu réel et le vecteur de popularité de l'ID du produit. Pour résoudre les différences de distribution à longue traîne, nous nous appuyons sur le paradigme de l'adaptation de domaine pour aligner la distribution globale, et sur le paradigme de l'apprentissage contrastif pour aligner les distributions d'instances.
Présentons d'abord la structure de base du modèle de base. Le modèle de base est en fait un modèle classique à deux tours. Ensuite, nous présenterons en détail comment nous résolvons les deux problèmes mentionnés précédemment (différence de distribution de popularité et différence de distribution à longue traîne).
1. Le module de découplage des fonctionnalités atténue les différences dans la distribution de la popularité
Le module de découplage des fonctionnalités est une solution proposée dans cet article pour résoudre le problème du biais de popularité dans les systèmes de recommandation. Ce module réduit l'impact de la popularité sur la représentation vectorielle d'élément en séparant les informations de popularité des informations d'attribut dans la représentation vectorielle d'élément. Plus précisément, ce module comprend un encodeur de popularité et un encodeur d'attribut, et apprend la représentation vectorielle d'attribut et de popularité de chaque élément grâce à une combinaison de perceptrons multicouches. L'entrée de ce module correspond aux caractéristiques d'attribut de l'article, telles que l'ID de l'article, la catégorie de l'article, la marque, etc., comme indiqué dans la partie droite de la structure du modèle ci-dessus. Il y aura ici deux contraintes, notamment la régularisation orthogonale et la régularisation de similarité de popularité, visant à séparer les informations de popularité des informations d'attribut d'élément. Parmi eux, grâce à la régularisation de similarité de popularité, le module est encouragé à aligner les informations de popularité intégrées dans les attributs de l'article avec les informations de popularité réelles, tandis que grâce à la régularisation orthogonale, le module est encouragé à conserver différentes informations dans l'encodage, obtenant ainsi des informations de degré de popularité séparées. et des informations d'attribut d'article.
Nous avons également besoin d'un module pour connaître la popularité réelle, comme le montre la partie gauche de la structure du modèle ci-dessus. Son entrée est principalement les caractéristiques statistiques du produit, puis il passe par un MLP pour obtenir le. véritable représentation de la popularité.
2. La régularisation atténue les différences de distribution
Ensuite, nous voulons résoudre le problème des différences de distribution à longue traîne.
Nous nous appuyons sur l'idée de l'apprentissage par transfert pour parvenir à l'alignement de la distribution des produits populaires et des produits à longue traîne. Dans le modèle original à deux tours, nous avons introduit un produit non exposé et utilisé la fonction de perte MMD (comme indiqué dans le coin supérieur gauche de la figure ci-dessus). Cette fonction de perte espère que le cluster est centré sur le domaine de produit populaire et la longue traîne. Les domaines de produits sont aussi proches que possible, comme indiqué ci-dessus. Comme le montre le diagramme schématique en haut à droite de la figure. Étant donné que ce type d'alignement de domaine n'est pas supervisé et peut produire un transfert négatif, nous avons effectué les optimisations suivantes : le gradient des échantillons exposés sur la perte d'alignement de domaine est arrêté pour éviter qu'il n'affecte la perte de tâche pour les échantillons non exposés, un classement fin est effectué ; introduction de la distillation des connaissances. Nous nous appuyons également sur l'idée d'alignement d'instances, dans l'espoir d'apprendre de meilleures représentations vectorielles de produits. L'idée principale est que plus les cooccurrences de produits sont efficaces, plus les représentations vectorielles seront similaires. La difficulté ici est de savoir comment construire la paire. Une telle paire existe naturellement dans la séquence de produits où l'utilisateur a un comportement passé. En prenant un utilisateur comme exemple, un échantillon contient la séquence de comportement d'un utilisateur et les produits cibles. Ensuite, le produit cible et chaque produit de la séquence de comportement de l'utilisateur peuvent former une paire co-occurrente. Sur la base de la fonction de perte d'apprentissage contrastive classique, nous prenons également en compte la diversité des intérêts de l'utilisateur et la fréquence des produits. La formule spécifique de la fonction de perte est visible dans la partie inférieure gauche de la figure ci-dessus.
Nous pouvons regarder un diagramme schématique intuitif, comme le montre le coin inférieur droit de la figure ci-dessus. Les points gris sont les produits cibles, les points orange sont la séquence de comportement de l'utilisateur et les points bleus sont les échantillons négatifs obtenus par notre. échantillonnage négatif aléatoire. Nous espérons apprendre de la méthode d'apprentissage contrastif pour contraindre chaque produit de la séquence de comportement de l'utilisateur à être proche du produit cible.
3. Formation conjointe biaisée et impartialeLe module ci-dessus obtient efficacement la représentation impartiale du contenu et la représentation découplée de la popularité du produit. Comment devrions-nous l'appliquer ? Nous utilisons la méthode de formation conjointe du modèle non biaisé et du modèle biaisé.Le vecteur de produit non biaisé peut être extrait sur la base du module de découplage et de la régularisation. Afin de pouvoir utiliser les informations de popularité, nous introduisons également la fonctionnalité de popularité, et le modèle biaisé le fera. hériter seulement Le biais de popularité n'exacerbe pas les préjugés. Pour la partie service en ligne, comme indiqué sur le côté droit de la figure ci-dessus, nous fusionnons la représentation impartiale du produit et la représentation biaisée du produit via le paramètre α pour obtenir la représentation du produit en ligne, afin que le produit puisse être rappelé via le vecteur utilisateur. α est l'ajustement Rappeler dans quelle mesure l'attention est accordée aux informations sur la popularité. #🎜🎜 #
4, hors ligne et expérience en ligne
L'image ci-dessus montre les effets hors ligne et en ligne de ce modèle. Dans les expériences hors ligne, nous avons introduit l'indicateur C-Ratio pour mesurer combien d'éléments dans les résultats du rappel sont des éléments hautement exposés. Grâce à des expériences hors ligne, nous pouvons constater que chaque module contribue dans une certaine mesure. Le modèle impartial n’apporte aucun gain en termes d’indicateurs d’efficacité en ligne, ce qui indique que les informations sur la popularité sont utiles, et nous devons toujours utiliser un modèle biaisé pour utiliser les informations sur la popularité.
Enfin, nous avons réalisé un affichage visuel des résultats du modèle. Nous avons constaté que la nouvelle structure du modèle peut effectivement aligner la distribution des produits hautement explosifs et des produits à longue traîne. Le vecteur de représentation de popularité découplé et la représentation impartiale du contenu du produit n'ont presque aucune intersection, et les produits ayant le même objectif peuvent être plus proches. relations. En ajustant α, le modèle peut s'adapter de manière directionnelle aux intérêts suivants et aux intérêts réels de l'utilisateur.
Le titre de l'article partagé d'aujourd'hui est "Co-formation d'un réseau d'adaptation de domaine démêlé pour tirer parti des biais de popularité chez les recommandateurs".
5. Séance de questions-réponses
Q1 : Comment les échantillons non exposés sont-ils ajoutés à l'échantillon ? dans?
A1 : généré hors ligne, nous pouvons obtenir l'échantillon positif cible et la catégorie correspondante, puis échantillonner aléatoirement un certain nombre d'échantillons hors ligne. . Un produit de la même catégorie que l'échantillon positif cible est monté dans l'échantillon d'apprentissage.
Q2 : L'introduction d'échantillons similaires non exposés augmentera-t-elle la difficulté d'apprentissage ?
A2 : Les échantillons non exposés introduits n'ont pas d'étiquettes et sont distribués de manière non supervisée. Il peut y avoir un transfert négatif. Nous avons utilisé deux techniques pour résoudre ce problème : le gradient des échantillons exposés. sur la perte d'alignement de domaine est arrêtée pour éviter d'affecter la perte de tâches ; pour les échantillons non exposés, un classement fin peut être introduit pour la distillation des connaissances.Q3 : Est-ce que cela coûtera très cher d'obtenir des scores de classification fins pour des échantillons non exposés ?
A3 : Utilisez le modèle de classement fin pour noter l'échantillon hors ligne et utilisez-le comme fonctionnalité.
Q4 : Les échantillons non exposés sont-ils les échantillons non exposés de la collection fine ?
A4 : Non, il y a une forte probabilité qu'il s'agisse encore d'un produit hautement explosif. Nous utilisons les résultats d'un échantillonnage aléatoire dans le cadre global. même catégorie.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment utiliser le langage Go et Redis pour mettre en œuvre un système de recommandation. Le système de recommandation est un élément important de la plate-forme Internet moderne. Il aide les utilisateurs à découvrir et à obtenir des informations intéressantes. Le langage Go et Redis sont deux outils très populaires qui peuvent jouer un rôle important dans le processus de mise en œuvre de systèmes de recommandation. Cet article expliquera comment utiliser le langage Go et Redis pour implémenter un système de recommandation simple et fournira des exemples de code spécifiques. Redis est une base de données open source en mémoire qui fournit une interface de stockage de paires clé-valeur et prend en charge une variété de données

Avec le développement et la vulgarisation continus de la technologie Internet, les systèmes de recommandation, en tant que technologie importante de filtrage des informations, sont de plus en plus largement utilisés et pris en compte. En termes de mise en œuvre d'algorithmes de système de recommandation, Java, en tant que langage de programmation rapide et fiable, a été largement utilisé. Cet article présentera les algorithmes et les applications du système de recommandation implémentés en Java, et se concentrera sur trois algorithmes de système de recommandation courants : l'algorithme de filtrage collaboratif basé sur l'utilisateur, l'algorithme de filtrage collaboratif basé sur les éléments et l'algorithme de recommandation basé sur le contenu. L'algorithme de filtrage collaboratif basé sur l'utilisateur est basé sur le filtrage collaboratif basé sur l'utilisateur

Avec la popularité des applications Internet, l’architecture des microservices est devenue une méthode d’architecture populaire. Parmi eux, la clé de l'architecture des microservices est de diviser l'application en différents services et de communiquer via RPC pour obtenir une architecture de services faiblement couplée. Dans cet article, nous présenterons comment utiliser go-micro pour créer un système de recommandation de microservices basé sur des cas réels. 1. Qu'est-ce qu'un système de recommandation de microservices ? Un système de recommandation de microservices est un système de recommandation basé sur une architecture de microservices qui intègre différents modules dans le système de recommandation (tels que l'ingénierie des fonctionnalités, la classification).

1. Introduction au scénario Tout d’abord, introduisons le scénario impliqué dans cet article : le scénario « de bons produits sont disponibles ». Son emplacement se trouve dans la grille à quatre carrés de la page d'accueil de Taobao, qui est divisée en une page de sélection à un saut et une page d'acceptation à deux sauts. Il existe deux formes principales de pages d'hébergement, l'une est une page d'hébergement de graphiques et de textes, et l'autre est une courte page d'hébergement de vidéos. L’objectif de ce scénario est principalement de fournir aux utilisateurs des biens satisfaisants et de stimuler la croissance du GMV, exploitant ainsi davantage l’offre d’experts. 2. Qu'est-ce que le biais de popularité et pourquoi nous abordons ensuite le sujet de cet article, le biais de popularité. Qu’est-ce que le biais de popularité ? Pourquoi un biais de popularité se produit-il ? 1. Qu'est-ce que le biais de popularité ? Le biais de popularité a de nombreux alias, tels que l'effet Matthew et le cocon d'information. Intuitivement, il s'agit d'un carnaval de produits hautement explosifs. Cela entraînera

Avec le développement et la vulgarisation continus de la technologie du cloud computing, les systèmes de recherche et de recommandation dans le cloud deviennent de plus en plus populaires. En réponse à cette demande, le langage Go apporte également une bonne solution. Dans le langage Go, nous pouvons utiliser ses capacités de traitement simultané à grande vitesse et ses riches bibliothèques standard pour mettre en œuvre un système efficace de recherche et de recommandation dans le cloud. Ce qui suit présentera comment le langage Go implémente un tel système. 1. Recherche sur le cloud Tout d'abord, nous devons comprendre la posture et les principes de la recherche. La posture de recherche fait référence aux pages correspondantes du moteur de recherche en fonction des mots-clés saisis par l'utilisateur.

1. Contexte du problème : la nécessité et l'importance de la modélisation du démarrage à froid. En tant que plate-forme de contenu, Cloud Music propose chaque jour une grande quantité de nouveaux contenus. Bien que la quantité de nouveau contenu sur la plate-forme musicale cloud soit relativement faible par rapport à d'autres plates-formes telles que les courtes vidéos, la quantité réelle peut dépasser de loin l'imagination de chacun. Dans le même temps, le contenu musical est très différent des courtes vidéos, des actualités et des recommandations de produits. Le cycle de vie de la musique s’étend sur des périodes extrêmement longues, souvent mesurées en années. Certaines chansons peuvent exploser après avoir été inactives pendant des mois ou des années, et les chansons classiques peuvent encore avoir une forte vitalité même après plus de dix ans. Par conséquent, pour le système de recommandation des plateformes musicales, il est plus important de découvrir des contenus impopulaires et de longue traîne de haute qualité et de les recommander aux bons utilisateurs que de recommander d'autres catégories.

1. Contexte de la correction de cause à effet 1. Un écart se produit dans le système de recommandation. Des données sont collectées pour entraîner le modèle de recommandation à recommander les éléments appropriés aux utilisateurs. Lorsque les utilisateurs interagissent avec les éléments recommandés, les données collectées sont utilisées pour entraîner davantage le modèle, formant ainsi une boucle fermée. Cependant, il peut y avoir divers facteurs d'influence dans cette boucle fermée, entraînant des erreurs. La principale raison de l'erreur est que la plupart des données utilisées pour entraîner le modèle sont des données d'observation plutôt que des données d'entraînement idéales, qui sont affectées par des facteurs tels que la stratégie d'exposition et la sélection des utilisateurs. L’essence de ce biais réside dans la différence entre les attentes des estimations empiriques du risque et les attentes des véritables estimations du risque idéal. 2. Biais courants Il existe trois principaux types de biais courants dans les systèmes de marketing de recommandation : Biais sélectif : il est dû à la racine de l'utilisateur.

Avec le développement rapide d’Internet, les systèmes de recommandation sont devenus de plus en plus importants. Un système de recommandation est un algorithme utilisé pour prédire les éléments intéressant un utilisateur. Dans les applications Internet, les systèmes de recommandation peuvent fournir des suggestions et des recommandations personnalisées, améliorant ainsi la satisfaction des utilisateurs et les taux de conversion. PHP est un langage de programmation largement utilisé dans le développement Web. Cet article explorera les systèmes de recommandation et la technologie de filtrage collaboratif en PHP. Principes des systèmes de recommandation Les systèmes de recommandation s'appuient sur des algorithmes d'apprentissage automatique et l'analyse des données. Ils analysent et prédisent le comportement historique des utilisateurs.
