


Décomposition matricielle de Poisson : un algorithme de décomposition matricielle qui résout le problème de démarrage à froid des systèmes de recommandation sans données
Auteur | Wang Hao
Critique | Sun Shujuan
Le système de recommandation est l'une des technologies les plus populaires de l'industrie Internet. Au cours de la dernière décennie, l’industrie Internet a produit des millions de versions itératives de modèles de systèmes de recommandation. Bien qu’il existe de nombreux modèles de systèmes de recommandation optimisés pour différents scénarios, il existe très peu de modèles classiques. La décomposition matricielle est un algorithme de système de recommandation qui a émergé au début du domaine des systèmes de recommandation et a montré son importance dans la compétition Netflix. C'est également l'algorithme de système de recommandation le plus réussi des dix dernières années. Bien qu'aujourd'hui en 2023, le domaine des systèmes de recommandation ait longtemps été dominé par l'apprentissage profond, la décomposition matricielle est encore largement utilisée dans les processus de recherche et développement des grandes entreprises, et de nombreux chercheurs scientifiques travaillent encore sur des algorithmes associés.
L'article le plus classique sur l'algorithme de factorisation matricielle est la factorisation matricielle probabiliste de 2007. Sur cette base, les générations suivantes ont réalisé de nombreux travaux d'expansion, comme RankMat en 2021 (adresse de téléchargement papier : https://arxiv.org/abs/2204.13016), ZeroMat (adresse de téléchargement papier : https://arxiv.org/abs/2204.13016). org /abs/2112.03084) et DotMat en 2022 (adresse de téléchargement du papier : https://arxiv.org/abs/2206.00151), KL-Mat (adresse de téléchargement du papier : https://arxiv.org/abs/2204.13583/ code download Adresse : https://github.com/haow85/KL-Mat), etc. Les systèmes de recommandation sont très appréciés des ingénieurs du secteur Internet en raison de leur simplicité, de leur facilité d'utilisation et de leur rapidité.
Le problème du démarrage à froid des systèmes de recommandation est un autre point chaud de la recherche qui a beaucoup retenu l'attention cette année. Les idées de nombreux praticiens pour résoudre les systèmes de recommandation sont l'apprentissage par transfert et le méta-apprentissage. Cependant, cette idée présente un défaut fatal : elle nécessite des données provenant d’autres domaines de connaissances. De nombreuses entreprises ne remplissent pas cette condition. L’algorithme de démarrage à froid, qui ne nécessite en réalité aucune donnée, est apparu après la proposition de ZeroMat en 2021. Les algorithmes représentatifs incluent ZeroMat et DotMat mentionnés dans la section précédente. L'algorithme de décomposition matricielle de Poisson (PoissonMat) qui sera présenté dans cet article est un article publié lors de la Conférence académique internationale MLISE 2022. Le nom de l'article est PoissonMat : Remodelage de la factorisation matricielle à l'aide de la distribution de Poisson et résolution du problème de démarrage à froid sans données d'entrée (adresse de téléchargement de l'article : https://arxiv.org/abs/2212.10460).
Nous examinons d'abord la définition MAP de la factorisation matricielle probabiliste :
Nous définissons ensuite le comportement des utilisateurs évaluant les éléments comme une distribution de Poisson. D'après la définition de la distribution de Poisson, on obtient la formule suivante :
D'après la définition des paramètres dans la formule de Poisson, on a :
Selon la distribution Zipf, on peut obtenir la formule suivante :
Sur la base de la formule ci-dessus, nous obtenons la forme analytique de décomposition matricielle de Poisson (PoissonMat) :
En utilisant l'algorithme de descente de gradient stochastique pour résoudre la formule ci-dessus, nous obtenons la flux d'algorithme suivant :
L'auteur a ensuite mené une comparaison expérimentale de la précision et de l'équité de l'algorithme sur l'ensemble de données MovieLens 1 Million et l'ensemble de données LDOS-CoMoDa :
Figure 1 Matrice de Poisson décomposition dans MovieLens 1 Million Dataset Expérience comparative sur
Figure 2 Expérience comparative de décomposition matricielle de Poisson sur l'ensemble de données LDOS-CoMoDa
Sur la base des résultats de la comparaison expérimentale, nous pouvons tirer les conclusions suivantes : La décomposition matricielle de Poisson (PoissonMat) a de meilleures performances en termes de précision et d'équité les indicateurs sont meilleurs que les autres algorithmes. Et ce qui est louable, c'est que l'algorithme de décomposition matricielle de Poisson n'utilise aucune donnée d'entrée. Il s'agit d'un algorithme d'apprentissage complet à échantillon nul, qui résout très bien le problème du démarrage à froid.
Enfin, l'auteur a mené l'expérience sur un ordinateur portable Lenovo avec 16 Go de RAM et Intel Core i5. L'algorithme s'exécute très rapidement et la mise en œuvre est très simple.
L'algorithme d'apprentissage zéro-shot, qui vise à résoudre le problème du démarrage à froid des systèmes de recommandation, est actuellement un point chaud de la recherche. Un véritable algorithme d'apprentissage zéro-shot qui ne nécessite aucune donnée pour résoudre les problèmes d'apprentissage zéro-shot, à partir de l'algorithme ZeroMat en 2021. L'algorithme de décomposition matricielle de Poisson (PoissonMat) présenté dans cet article a de meilleures performances que ZeroMat et son algorithme ultérieur DotMat, et est actuellement l'un des meilleurs algorithmes dans ce domaine. Étant donné que la recherche pertinente en est encore à ses balbutiements, nous espérons qu’elle attirera l’attention et l’attention de la majorité des praticiens de la science et de la technologie.
Présentation de l'auteur
Wang Hao, ancien chef du laboratoire d'intelligence artificielle Funplus, ancien chef du département Big Data de Hengchang Litong. Diplômé de l'Université de l'Utah aux États-Unis avec un baccalauréat (2008) et un master (2010). MBA à temps partiel de l'Université de commerce international et d'économie (2016). Dans les systèmes de recommandation (équité/recommandation basée sur des scénarios/démarrage à froid/interprétabilité/apprentissage par classement), infographie (modélisation/visualisation géométrique), traitement du langage naturel (applications de mise en œuvre dans l'industrie), contrôle des risques et anti-fraude (Finance/médical) et d'autres directions avec de nombreuses années d'expérience et des idées uniques. Il possède 12 ans d'expérience en R&D technologique et en gestion dans Internet (Douban, Baidu, Sina, NetEase, etc.), dans la technologie financière (Hengchang Litong) et dans les sociétés de jeux (Funplus, etc.). A publié 30 articles dans des conférences et revues universitaires internationales et a remporté 3 prix du meilleur article/prix du meilleur rapport de conférence internationale (Prix du meilleur article IEEE SMI 2008/Prix de la meilleure présentation orale ICBDT 2020/Prix de la meilleure présentation orale ICISCAE 2021). Médaille d'or de la compétition régionale nord-américaine des Rocheuses de l'ACM/ICPC 2006. 2004 Médaille de bronze à la finale d'expression orale du National College English Proficiency Competition. En 2003, il a remporté la première place en anglais en sciences et ingénierie à l'examen d'entrée au Jinan College.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Écrit ci-dessus et compréhension personnelle de l'auteur : À l'heure actuelle, dans l'ensemble du système de conduite autonome, le module de perception joue un rôle essentiel. Le véhicule autonome roulant sur la route ne peut obtenir des résultats de perception précis que via le module de perception en aval. dans le système de conduite autonome, prend des jugements et des décisions comportementales opportuns et corrects. Actuellement, les voitures dotées de fonctions de conduite autonome sont généralement équipées d'une variété de capteurs d'informations de données, notamment des capteurs de caméra à vision panoramique, des capteurs lidar et des capteurs radar à ondes millimétriques pour collecter des informations selon différentes modalités afin d'accomplir des tâches de perception précises. L'algorithme de perception BEV basé sur la vision pure est privilégié par l'industrie en raison de son faible coût matériel et de sa facilité de déploiement, et ses résultats peuvent être facilement appliqués à diverses tâches en aval.

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

La couche inférieure de la fonction de tri C++ utilise le tri par fusion, sa complexité est O(nlogn) et propose différents choix d'algorithmes de tri, notamment le tri rapide, le tri par tas et le tri stable.

01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection

La convergence de l’intelligence artificielle (IA) et des forces de l’ordre ouvre de nouvelles possibilités en matière de prévention et de détection de la criminalité. Les capacités prédictives de l’intelligence artificielle sont largement utilisées dans des systèmes tels que CrimeGPT (Crime Prediction Technology) pour prédire les activités criminelles. Cet article explore le potentiel de l’intelligence artificielle dans la prédiction de la criminalité, ses applications actuelles, les défis auxquels elle est confrontée et les éventuelles implications éthiques de cette technologie. Intelligence artificielle et prédiction de la criminalité : les bases CrimeGPT utilise des algorithmes d'apprentissage automatique pour analyser de grands ensembles de données, identifiant des modèles qui peuvent prédire où et quand les crimes sont susceptibles de se produire. Ces ensembles de données comprennent des statistiques historiques sur la criminalité, des informations démographiques, des indicateurs économiques, des tendances météorologiques, etc. En identifiant les tendances qui pourraient échapper aux analystes humains, l'intelligence artificielle peut donner du pouvoir aux forces de l'ordre.

1. Contexte du problème : la nécessité et l'importance de la modélisation du démarrage à froid. En tant que plate-forme de contenu, Cloud Music propose chaque jour une grande quantité de nouveaux contenus. Bien que la quantité de nouveau contenu sur la plate-forme musicale cloud soit relativement faible par rapport à d'autres plates-formes telles que les courtes vidéos, la quantité réelle peut dépasser de loin l'imagination de chacun. Dans le même temps, le contenu musical est très différent des courtes vidéos, des actualités et des recommandations de produits. Le cycle de vie de la musique s’étend sur des périodes extrêmement longues, souvent mesurées en années. Certaines chansons peuvent exploser après avoir été inactives pendant des mois ou des années, et les chansons classiques peuvent encore avoir une forte vitalité même après plus de dix ans. Par conséquent, pour le système de recommandation des plateformes musicales, il est plus important de découvrir des contenus impopulaires et de longue traîne de haute qualité et de les recommander aux bons utilisateurs que de recommander d'autres catégories.

1. Contexte de la construction de la plateforme 58 Portraits Tout d'abord, je voudrais partager avec vous le contexte de la construction de la plateforme 58 Portraits. 1. La pensée traditionnelle de la plate-forme de profilage traditionnelle ne suffit plus. La création d'une plate-forme de profilage des utilisateurs s'appuie sur des capacités de modélisation d'entrepôt de données pour intégrer les données de plusieurs secteurs d'activité afin de créer des portraits d'utilisateurs précis. Elle nécessite également l'exploration de données pour comprendre le comportement et les intérêts des utilisateurs. et besoins, et fournir des capacités côté algorithmes ; enfin, il doit également disposer de capacités de plate-forme de données pour stocker, interroger et partager efficacement les données de profil utilisateur et fournir des services de profil. La principale différence entre une plate-forme de profilage d'entreprise auto-construite et une plate-forme de profilage de middle-office est que la plate-forme de profilage auto-construite dessert un seul secteur d'activité et peut être personnalisée à la demande. La plate-forme de mid-office dessert plusieurs secteurs d'activité et est complexe ; modélisation et offre des fonctionnalités plus générales. 2.58 Portraits d'utilisateurs de l'arrière-plan de la construction du portrait sur la plate-forme médiane 58

Analyse d'algorithme PHP : Une méthode efficace pour trouver les nombres manquants dans un tableau. Dans le processus de développement d'applications PHP, nous rencontrons souvent des situations où nous devons trouver des nombres manquants dans un tableau. Cette situation est très courante dans le traitement des données et la conception d'algorithmes, nous devons donc maîtriser des algorithmes de recherche efficaces pour résoudre ce problème. Cet article présentera une méthode efficace pour trouver les nombres manquants dans un tableau et joindra des exemples de code PHP spécifiques. Description du problème Supposons que nous ayons un tableau contenant des nombres entiers compris entre 1 et 100, mais qu'il manque un nombre. Nous devons concevoir un
