Table des matières
1. Des données aléatoires aux données observées " > 1. Des données aléatoires aux données observées
2. Apprentissage de la représentation causale" >2. Apprentissage de la représentation causale
3. Modèle de crédit contrefactuel Mono-CFR" > 3. Modèle de crédit contrefactuel Mono-CFR
Comment évaluer la courbe d'estimation des risques du quota hors ligne ? " >Comment évaluer la courbe d'estimation des risques du quota hors ligne ?
Maison Périphériques technologiques IA Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Jun 03, 2023 pm 10:16 PM
因果推断 度小满

1. Paradigme de recherche sur l'inférence causale cadre de sortie potentiel

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Dans le livre "The Book of Why – The New Science of Cause and Effect" de Judea Pearl, l'échelle cognitive se positionne sur trois niveaux :

  • Le premier niveau - corrélation : découvrez les règles grâce à la corrélation, qui peuvent être directement observées
  • Le deuxième niveau - intervention : si le statu quo est modifié, quelles actions doivent être mises en œuvre et quelles conclusions peuvent être tirées, vous pouvez Observation expérimentale

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Le troisième niveau - Contrefactuel : En raison de problèmes tels que les lois et les réglementations, l'observation expérimentale directe n'est pas possible grâce à des hypothèses contrefactuelles, que se passera-t-il si l'action est mise en œuvre et comment évaluer l'ATE et le CATE, est plus difficile Une question.

    Tout d'abord, expliquons les quatre manières de générer des corrélations :
  • 1 Corrélation causale
  •  : Il existe une dépendance fiable, traçable et positive entre la cause et le résultat. . Les relations, telles que la fumée et les avertisseurs de fumée, sont liées de manière causale :
  • 2. Corrélations confuses 
  •  : Contient des variables confusionnelles qui ne peuvent pas être directement observées, telles que la question de savoir si la taille et la capacité de lecture peuvent être liées, ainsi que l'âge. doit être contrôlé Les variables sont similaires, tirant ainsi des conclusions valables

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

3. Biais de sélection

 : C'est essentiellement le paradoxe de Berkson, comme l'exploration de la relation entre l'apparence et le talent, s'il est seulement observé parmi les stars. groupes, on pourrait en conclure que l’apparence et le talent ne font pas bon ménage. Si on l’observe chez tous les humains, il n’y a pas de relation causale entre l’apparence et le talent.

4. Causalité inversée

 : C'est-à-dire l'inversion de la cause et de l'effet. Par exemple, les statistiques montrent que plus les humains sont mariés longtemps, plus leur durée de vie est longue. Mais à l’inverse, on ne peut pas dire : si vous voulez vivre plus longtemps, vous devez vous marier tôt.

Comment les facteurs de confusion affectent les résultats d'observation, voici deux cas pour illustrer :

L'image ci-dessus décrit la relation entre le volume d'exercice et les niveaux de cholestérol. D’après l’image de gauche, nous pouvons conclure que plus on fait d’exercice, plus le taux de cholestérol est élevé. Cependant, lorsque la stratification par âge est ajoutée, sous la même stratification par âge, plus la quantité d'exercice est importante, plus le taux de cholestérol est bas. De plus, à mesure que nous vieillissons, les taux de cholestérol augmentent progressivement, cette conclusion est donc cohérente avec nos connaissances.

Le deuxième exemple est le scénario du crédit. Il ressort des statistiques historiques que plus la limite donnée (le montant d’argent pouvant être emprunté) est élevée, plus le taux de retard est bas. Cependant, dans le domaine financier, la qualification de crédit de l'emprunteur sera d'abord jugée sur la base de sa carte A. Si la qualification de crédit est meilleure, la plateforme accordera une limite plus élevée et le taux global de retard sera très faible. Cependant, des expériences aléatoires locales montrent que pour les personnes ayant les mêmes qualifications de crédit, il y aura certaines personnes dont la courbe de migration de la limite de crédit changera relativement lentement, et il y aura également des personnes dont le risque de migration de la limite de crédit sera plus élevé, c'est-à-dire après le crédit. La limite est augmentée, l'augmentation du risque sera plus importante.

Les deux cas ci-dessus illustrent que si les facteurs de confusion sont ignorés dans la modélisation, des conclusions erronées, voire opposées, peuvent être obtenues.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Comment passer des échantillons aléatoires ECR à la modélisation causale des échantillons observationnels ?

Pour le cas des échantillons RCT, si vous souhaitez évaluer l'indicateur ATE, vous pouvez utiliser la soustraction de groupe ou DID (différence de différence). Si vous souhaitez évaluer l'indicateur CATE, vous pouvez utiliser la modélisation ascendante. Les méthodes courantes incluent le méta-apprenant, le double apprentissage automatique, la forêt causale, etc. Il y a trois hypothèses nécessaires à noter ici : SUTVA, absence de confusion et positivité. L’hypothèse de base est qu’il n’existe aucun facteur de confusion non observé.

Pour le cas où il n'y a que des échantillons d'observation, la relation causale entre traitement-> résultat ne peut pas être obtenue directement. Nous devons utiliser les moyens nécessaires pour couper le chemin dérobé des covariables au traitement. Les méthodes courantes sont les méthodes de variables instrumentales et l’apprentissage des représentations contrefactuelles. La méthode des variables instrumentales doit décortiquer les détails de l’entreprise spécifique et tracer un diagramme de cause à effet des variables commerciales. L'apprentissage des représentations contrefactuelles repose sur un apprentissage automatique mature pour faire correspondre des échantillons avec des covariables similaires à des fins d'évaluation causale.

2. L'évolution du cadre d'inférence causale

1. Des données aléatoires aux données observées

Ensuite, nous présenterons l'évolution du cadre d'inférence causale, et comment pour passer à l'apprentissage de la représentation causale étape par étape.

Les modèles Uplift courants incluent : Slearner, Tlearner, Xlearner.

où Slearner traite les variables intermédiaires comme des caractéristiques unidimensionnelles. Il convient de noter que dans les modèles d’arbres courants, le traitement est facilement dépassé, ce qui entraîne des estimations plus faibles de l’effet du traitement.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Tlearner discrétise le traitement, modélise les variables intermédiaires en groupes, construit un modèle de prédiction pour chaque traitement, puis fait une différence. Il est important de noter que des échantillons de plus petite taille conduisent à des variances estimées plus élevées.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Modélisation croisée du groupe Xlearner, le groupe expérimental et le groupe témoin sont calculés de manière croisée et formés séparément. Cette méthode combine les avantages de l'apprenant S/T, mais son inconvénient est qu'elle introduit des erreurs de structure de modèle plus élevées et augmente la difficulté d'ajustement des paramètres.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Comparaison de trois modèles :

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Dans la figure ci-dessus, l'axe horizontal est l'effet causal complexe, l'erreur d'estimation de MSE, et l'axe vertical est Effet de causalité simple, l'axe horizontal et l'axe vertical représentent respectivement deux éléments de données. Le vert représente la distribution des erreurs de Slearner, le marron représente la distribution des erreurs de Tlearner et le bleu représente la distribution des erreurs de Xlearner.

Dans des conditions d'échantillonnage aléatoire, Xlearner est meilleur pour l'estimation d'effet causal complexe et l'estimation d'effet causal simple ; Slearner est relativement médiocre pour l'estimation d'effet causal complexe et est meilleur pour l'estimation d'effet causal simple ;

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

S'il y a des échantillons aléatoires, les flèches de X à T peuvent être supprimées. Après le passage à la modélisation observationnelle, les flèches de X à T ne peuvent pas être supprimées. Le traitement et les résultats seront affectés en même temps par les facteurs confondants. À ce stade, un certain traitement de dépolarisation peut être effectué. Par exemple, la méthode DML (Double Machine Learning) effectue une modélisation en deux étapes. Dans la première étape, X voici les propres caractéristiques de représentation de l’utilisateur, telles que l’âge, le sexe, etc. Les variables confusionnelles pourraient inclure, par exemple, les efforts historiques visant à éliminer des groupes spécifiques de personnes. Dans la deuxième étape, l'erreur sur le résultat du calcul de l'étape précédente est modélisée, voici l'estimation de CATE.

Il existe trois méthodes de traitement des données aléatoires aux données d'observation :

(1) Faire des expériences aléatoires, mais le coût commercial est plus élevé

(2) Trouver des variables instrumentales ; , généralement Relativement difficile ;

(3) Supposons que tous les facteurs de confusion sont observés et utilisez le DML, l'apprentissage des représentations et d'autres méthodes pour faire correspondre des échantillons similaires.

2. Apprentissage de la représentation causale

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

L'idée centrale de l'apprentissage contrefactuel est d'équilibrer la distribution des caractéristiques sous différents traitements.

Il y a deux questions principales :

1 Comment ajuster le poids des échantillons d'entraînement ?

2. Comment répartir plus uniformément les échantillons transformés dans le groupe expérimental et le groupe témoin dans l'espace de représentation ?

L'idée essentielle est de trouver son "jumeau" contrefactuel pour chaque échantillon après cartographie de transformation. Après cartographie, la distribution de X dans le groupe de traitement et le groupe témoin est relativement similaire.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Le travail le plus représentatif est un article publié sur TKDE 2022, qui présente certains travaux de DeR-CFR. Cette partie est en fait une itération du modèle DR-CRF, utilisant une méthode de séparation sans modèle. variables observées.

Divisez la variable X en trois parties : la variable d'ajustement A, la variable instrumentale I et la variable de confusion C. Ensuite, I, C et A sont utilisés pour ajuster le poids de X sous différents traitements afin d'atteindre l'objectif de modélisation causale sur les données observées.

L'avantage de cette méthode est qu'elle peut séparer les facteurs de confusion et réduire les biais d'estimation. L’inconvénient est qu’il est difficile de gérer des interventions continues.

Le cœur de ce réseau est de savoir comment séparer les trois types de variables A/I/C. La variable d'ajustement A n'est liée qu'à Y, et il faut s'assurer que A et T sont orthogonaux, et l'erreur empirique de A à Y est faible, la variable instrumentale I n'est liée qu'à T, et elle doit satisfaire le ; indépendance conditionnelle de I et Y par rapport à T, et expérience de I par rapport à T L'erreur est faible ; la variable de confusion C est liée à la fois à T et Y, et w est le poids du réseau après avoir donné le réseau. poids, il faut s’assurer que C et T sont conditionnellement indépendants par rapport à w. L'orthogonalité ici peut être obtenue grâce à des formules de distance générales, telles que la perte de log ou la distance euclidienne mse et d'autres contraintes.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle


Il existe également de nouvelles études sur la manière de gérer l'intervention continue, publiées sur ICLR2021, qui fournissent une méthode d'estimation de l'intervention continue. L’inconvénient est qu’il est difficile de l’appliquer directement aux données d’observation (scénario CFR).

Map X sur Z. Z contient principalement les variables I et C dans la décomposition X mentionnée précédemment, c'est-à-dire que les variables qui contribuent au traitement sont extraites de X. Ici, le traitement continu est divisé en B têtes de segmentation/prédiction, et chaque fonction continue est convertie en une fonction linéaire segmentée pour minimiser la perte de log d'erreur empirique, qui est utilisée pour apprendre

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

puis utilisez-le pour apprendre Complétez Z et θ(t) pour apprendre.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

est le résultat. θ(t) est ici la clé du traitement du traitement continu. Il s'agit d'un modèle à coefficient variable, mais ce modèle ne gère que le traitement continu s'il s'agit de données d'observation, il ne peut pas garantir que chaque donnée du segment B est homogène.

3. Modèle de crédit contrefactuel Mono-CFR

Enfin, présentons le modèle de crédit contrefactuel de Du Xiaoman. Le problème principal ici est de résoudre le problème de l'estimation contrefactuelle du traitement continu sur les données d'observation.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

La question centrale est la suivante : comment concevoir un quota (empruntable) pour les utilisateurs afin de maximiser les profits de la plateforme ? La connaissance a priori ici est que plus la limite est élevée, plus les utilisateurs empruntent et plus le risque de défaut est élevé. Vice versa.

  • La première étape consiste à définir la formule de profit. Bénéfice = revenu de quota - risque de quota. La formule paraît simple, mais en réalité il y a de nombreux détails à ajuster. De cette manière, le problème se transforme en modélisation de la relation causale entre le montant et le risque (créances douteuses), et le montant et le revenu sur les données d'observation.
  • La deuxième étape consiste à estimer les revenus estimés et les créances irrécouvrables de l'utilisateur à chaque niveau de quota et à déterminer le montant maximum du profit.

Nous attendons de chaque utilisateur qu'il ait une courbe de profit comme le montre la figure ci-dessus et qu'il fasse des estimations contrefactuelles de la valeur des revenus à différents niveaux de quota.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Si vous voyez dans les données d'observation que plus le montant est élevé, plus le risque est faible, essentiellement en raison de l'existence de facteurs confondants. Le facteur de confusion dans notre scénario concerne les qualifications créditées. Pour les personnes ayant de bonnes qualifications en matière de crédit, la plateforme accordera une limite plus élevée, et vice versa. Le risque absolu des personnes ayant d’excellentes qualifications en matière de crédit reste nettement inférieur à celui des personnes ayant de faibles qualifications en matière de crédit. Si vous améliorez vos qualifications de crédit, vous verrez que l'augmentation de la limite entraînera une augmentation du risque et que la limite supérieure dépassera la propre solvabilité de l'utilisateur.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Nous commençons à présenter le cadre du modèle de crédit contrefactuel. Parmi les variables observables .

  • Variable instrumentale I : telle que la politique, la demande, etc., qui affectera la stratégie de quota historique, mais n'affectera pas la probabilité de retard.
  • Variables C déroutantes : telles que le crédit, le revenu et le passif, etc., qui affectent simultanément l'ajustement de la limite et la probabilité de retard de la personne.
  • Ajustement de la variable A : telle que l'environnement, le statut social, etc., affectera le taux de retard.

Idée de modèle : étant donné la quantité attendue μ(T|X), apprenez la relation monotone entre ΔT et Y (courbe dose-réponse). La quantité attendue peut être comprise comme la quantité de tendance de continuité apprise par le modèle, de sorte que la relation entre la variable de confusion C et la quantité T puisse être déconnectée et convertie en l'apprentissage de la relation causale entre ΔT et Y, de manière à comparer la distribution. de Y sous ΔT Bonne caractérisation.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle


Le cadre abstrait ci-dessus est affiné ici : ΔT est converti en un modèle à coefficient variable, puis connecté au réseau IntegrandNN. L'erreur de formation est divisée en deux parties : .

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle


Le α ici est un hyperparamètre qui mesure l'importance du risque.

Mono-CFR se compose de deux parties :

  • Réseau de propension au montant : prédit le montant de la préférence stratégique, de sorte que X⊥ΔT.

Fonction 1 : Distiller les variables de X qui sont les plus pertinentes pour T et minimiser l'erreur empirique.

Fonction 2 : Ancrage d'échantillons approximatifs sur des stratégies historiques.

  • Réseau monotone de risque : La relation monotone théorique entre la contrainte ΔT et Y.

Fonction 1 : Appliquer des contraintes monotones indépendantes aux variables à coefficients faibles.

Fonction 2 : Réduire les biais d'estimation.

Le problème se transforme en :

  • Réseau de propension en montant : Vérifier la relation entre la sortie ΔT et Y.
  • Réseau monotone de risque : Comment contraindre la monotonie de ΔT et Y ?

L'entrée réelle du réseau de propension au montant est la suivante :

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

L'axe horizontal est le groupe défini par le score de la carte A. On peut voir que sous différents montants de propension. μ(T|X) , la différence de crédit ΔT et le taux de retard Y montrent une relation croissante monotone, plus la qualité est mauvaise, plus la courbe de variation de la différence de crédit ΔT est raide, la courbe de variation réelle du taux de retard est également plus raide et la pente de. toute la courbe est plus grande. Les conclusions ici sont entièrement tirées de l’apprentissage de données historiques.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Cela peut être vu sur le tableau de répartition de Ceci est expliqué d'un point de vue pratique.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

D'un point de vue théorique, cela peut aussi être rigoureusement prouvé.

La deuxième partie est la mise en œuvre du réseau monotone de risque :

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

L'expression mathématique de la fonction ELU+1 est ici :

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

ΔT et le taux de retard affichent une tendance monotone à la hausse, qui est garantie par la dérivée de la fonction ELU+1 étant toujours supérieure ou égale à 0.

Ensuite, expliquez comment le réseau monotone du risque peut apprendre avec plus de précision pour les variables à coefficient faible :

Supposons qu'il existe une telle formule :

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Vous peut voir ici x1 est une variable à coefficient faible. Lorsque des contraintes de monotonie sont imposées sur x1, l'estimation de la réponse Y est plus précise. Sans une telle contrainte distincte, l'importance de x1 sera submergée par x2, ce qui entraînera un biais accru du modèle.

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

Comment évaluer la courbe d'estimation des risques du quota hors ligne ?

est divisé en deux parties :

  • Première partie : Vérification interprétable

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

personnes ayant des qualifications différentes Dessinez la limite de risque comme indiqué dans la figure ci-dessus Grâce à la courbe de changement, le modèle peut apprendre la distinction entre le quota réel et le taux de retard de différents niveaux de personnes ayant différentes qualifications (marqués par différentes couleurs dans la figure).

  • Partie 2 : Utilisez de petites expériences de trafic pour vérifier que l'écart de risque dans différentes plages d'augmentation de quota peut être obtenu grâce au regroupement ascendant.

Conclusion de l'expérience en ligne :

À condition que le quota augmente de 30 %, le montant des utilisateurs en retard diminue de plus de 20 %, les emprunts augmentent de 30 % et la rentabilité augmente de plus de 30%.

Attentes futures du modèle :

Séparez plus clairement les variables instrumentales et les variables modératrices sous une forme sans modèle, afin que le modèle puisse mieux fonctionner en matière de transfert de risque sur des groupes de mauvaise qualité.

Dans des scénarios commerciaux réels, le processus d'itération d'évolution du modèle de Du Xiaoman est le suivant :

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle

La première étape consiste à modéliser l'observation, à faire rouler en continu les données d'observation historiques, à effectuer un apprentissage causal contrefactuel, à ouvrir constamment de nouvelles fenêtres de formation et à compléter les sources de données externes.

La deuxième étape est l'itération du modèle. L'effet est vérifié sur la base d'échantillons aléatoires de petit trafic pour prendre en charge une itération efficace du modèle.

La troisième étape est la prise de décision commerciale. L'entreprise prend des décisions expérimentales basées sur les résultats du modèle pour vérifier l'amélioration de l'effet du modèle et obtenir des avantages commerciaux.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Résumé des principales idées techniques et méthodes d'inférence causale Résumé des principales idées techniques et méthodes d'inférence causale Apr 12, 2023 am 08:10 AM

Introduction : L'inférence causale est une branche importante de la science des données. Elle joue un rôle important dans l'évaluation des itérations de produits, des algorithmes et des stratégies d'incitation sur Internet et dans l'industrie. Elle combine des données, des expériences ou des modèles économétriques statistiques pour calculer l'impact de nouveaux changements. les avantages sont la base de la prise de décision. Cependant, l’inférence causale n’est pas une question simple. Tout d’abord, dans la vie quotidienne, les gens confondent souvent corrélation et causalité. La corrélation signifie souvent que deux variables ont tendance à augmenter ou à diminuer en même temps, mais la causalité signifie que nous voulons savoir ce qui se passera lorsque nous modifions une variable, ou que nous nous attendons à obtenir un résultat contrefactuel si nous l'avons fait dans le même temps. passé Si nous prenons des mesures différentes, y aura-t-il des changements dans le futur ? La difficulté, cependant, est que les données contrefactuelles sont souvent

Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle Modèle de quota Duxiaoman basé sur une inférence causale contrefactuelle Jun 03, 2023 pm 10:16 PM

1. Paradigme de recherche de l'inférence causale. Le paradigme de recherche a actuellement deux directions de recherche principales : le cadre de sortie potentiel du modèle de structure de Judea Pearl. Dans le livre de Judea Pearl « Le livre du pourquoi – La nouvelle science de la cause et de l'effet », l'échelle cognitive. se positionne en trois niveaux : le premier niveau - association : découvrir les règles par corrélation, qui peuvent être directement observées ; le deuxième niveau - intervention : si le statu quo est modifié, quelles actions doivent être mises en œuvre et quelles conclusions doivent être tirées. être observé à travers des expériences ; troisième niveau - contrefactuel : en raison de problèmes tels que les lois et les réglementations, il est impossible d'observer directement expérimentalement, et des hypothèses contrefactuelles sont formulées sur ce qui se serait passé si l'action avait été mise en œuvre, comme par exemple

Systèmes de recommandation basés sur l'inférence causale : bilan et perspectives Systèmes de recommandation basés sur l'inférence causale : bilan et perspectives Apr 12, 2024 am 09:01 AM

Le thème de ce partage concerne les systèmes de recommandation basés sur l'inférence causale. Nous passons en revue les travaux antérieurs connexes et proposons des perspectives futures dans cette direction. Pourquoi devons-nous utiliser des techniques d'inférence causale dans les systèmes de recommandation ? Les travaux de recherche existants utilisent l'inférence causale pour résoudre trois types de problèmes (voir l'article TOIS2023 de Gaoe et al. Causal Inference in Recommender Systems: ASurvey and Future Directions) : Premièrement, il existe divers biais (BIAS) dans les systèmes de recommandation et l'inférence causale. est un moyen efficace de supprimer ces outils de partialité. Les systèmes de recommandation peuvent être confrontés à des difficultés pour remédier à la rareté des données et à l’incapacité d’estimer avec précision les effets causals. pour résoudre

Concentrez-vous dessus ! ! Analyse de deux cadres algorithmiques majeurs pour l'inférence causale Concentrez-vous dessus ! ! Analyse de deux cadres algorithmiques majeurs pour l'inférence causale Jun 04, 2024 pm 04:45 PM

1. Les principales tâches du cadre global peuvent être divisées en trois catégories. La première est la découverte de structures causales, c'est-à-dire l'identification des relations causales entre les variables des données. La seconde est l’estimation des effets causals, c’est-à-dire la déduction des données sur le degré d’influence d’une variable sur une autre variable. Il convient de noter que cet impact ne fait pas référence à la nature relative, mais à la manière dont la valeur ou la distribution d'une autre variable change lorsqu'une variable intervient. La dernière étape consiste à corriger les biais, car dans de nombreuses tâches, divers facteurs peuvent entraîner une distribution différente des échantillons de développement et des échantillons d'application. Dans ce cas, l’inférence causale peut nous aider à corriger les biais. Ces fonctions conviennent à une variété de scénarios, le plus typique étant celui de la prise de décision. Grâce à l'inférence causale, nous pouvons comprendre comment les différents utilisateurs réagissent à notre comportement décisionnel. Deuxièmement, dans l'industrie

Application de la technologie de recommandation causale au marketing et à l'explicabilité Application de la technologie de recommandation causale au marketing et à l'explicabilité May 18, 2023 pm 01:58 PM

1. Prédiction de la sensibilité du gain Uplifit Concernant le gain Uplift, le problème commercial général peut être résumé comme suit : parmi les groupes de personnes définis, les spécialistes du marketing voudront savoir combien la nouvelle action marketing T=1 peut apporter par rapport à l'action marketing originale T =0. Quel est le bénéfice moyen (lift, ATE, AverageTreatmentEffect). Tout le monde fera attention à savoir si la nouvelle action marketing est plus efficace que l’originale. Dans le scénario d'assurance, les actions marketing font principalement référence aux recommandations d'assurance, telles que la rédaction et les produits révélés sur le module de recommandation. L'objectif est de trouver les groupes qui ont le plus gagné grâce aux actions marketing sous diverses actions et contraintes marketing, et de cibler. livraison (AudienceTargeting). Faisons d'abord une comparaison

Pratique de l'inférence causale dans la courte recommandation vidéo de Kuaishou Pratique de l'inférence causale dans la courte recommandation vidéo de Kuaishou Feb 05, 2024 pm 06:20 PM

1. Scénario de recommandation de courtes vidéos sur une seule colonne de Kuaishou 1. À propos de Kuaishou* Les données sont extraites du deuxième trimestre 2023. Kuaishou est une application communautaire de courte vidéo et de diffusion en direct qui a atteint un record impressionnant de MAU et de New DAU. Le concept central de Kuaishou est de permettre à chacun de devenir créateur et diffuseur de contenu en observant et en partageant la vie des gens ordinaires. Dans les applications Kuaishou, les scènes vidéo courtes sont principalement divisées en deux formes : simple colonne et double colonne. À l'heure actuelle, le trafic d'une seule colonne est relativement important et les utilisateurs peuvent parcourir le contenu vidéo de manière immersive en glissant de haut en bas. La présentation en double colonne est similaire à un flux d'informations. Les utilisateurs doivent sélectionner ceux qui les intéressent parmi les différents contenus apparaissant à l'écran et cliquer pour regarder. L’algorithme de recommandation est au cœur de l’écosystème commercial de Kuaishou et est important pour la répartition du trafic.

Comment mieux utiliser les données dans l'inférence causale ? Comment mieux utiliser les données dans l'inférence causale ? Apr 11, 2023 pm 07:43 PM

Introduction : Le titre de ce partage est « Comment mieux utiliser les données dans l'inférence causale ? ", qui présente principalement les travaux récents de l'équipe liés aux articles publiés sur les causes et les effets. Ce rapport présente comment nous pouvons utiliser davantage de données pour faire des inférences causales sous deux aspects. L'un consiste à utiliser des données de contrôle historiques pour atténuer explicitement le biais de confusion, et l'autre est l'inférence causale dans le cadre de la fusion de données multi-sources. Table des matières en texte intégral : Arbre causal de correction de l'arrière-plan de l'inférence causale Fusion de données causales GBCT dans les applications commerciales des fourmis 1. Contexte de l'inférence causale Les problèmes courants de prédiction d'apprentissage automatique sont généralement définis dans le même système. Par exemple, une distribution indépendante et identique est généralement supposée, comme la prédiction des fumeurs, des problèmes de prédiction tels que la probabilité de contracter un cancer du poumon et la classification des images. La question de cause à effet concerne le mécanisme derrière les données. Des questions courantes telles que.

La fraude à l'IA a-t-elle un taux de réussite de 100 % ? Le modèle anti-deep fake de Du Xiaoman « vainc la magie par la magie » La fraude à l'IA a-t-elle un taux de réussite de 100 % ? Le modèle anti-deep fake de Du Xiaoman « vainc la magie par la magie » May 30, 2023 pm 09:46 PM

2023-05-2610:22:19 Auteur : Song Junyi Récemment, un sujet #Le taux de réussite de la fraude AIF est proche de 100 %# est devenu une recherche brûlante sur Weibo. Une vidéo montrant un changement de visage d'IA a escroqué le représentant légal d'une entreprise technologique du Fujian de 4,3 millions de yuans en 10 minutes. Une arnaque liée à l'IA s'est également produite à l'étranger. Un e-mail contenant une vidéo du PDG de Google a conduit de nombreux blogueurs YouTube à télécharger des fichiers contenant des virus dangereux. Les deux incidents de fraude impliquaient une technologie deepfake. Il s’agit d’une méthode révolutionnaire qui existe depuis 6 ans. De nos jours, l’explosion de la technologie AIGC a rendu de plus en plus facile la création de vidéos deepfake difficiles à identifier. Pour le secteur financier où la reconnaissance faciale est largement utilisée,

See all articles