


Algorithme de recommandation Twitter open source de Musk, GitHub a atteint 10 000 étoiles en quelques secondes et a promis d'évoluer toutes les 24 à 48 heures
L’engagement open source de Musk s’est enfin réalisé.
Tout à l'heure, Musk a officiellement annoncé :
La plupart des algorithmes de recommandation (de Twitter) seront aujourd'hui open source, et les autres suivront.
Et Musk a immédiatement montré l'adresse du code source de l'algorithme de recommandation Twitter sur GitHub.
En quelques heures seulement, des dizaines de milliers d'étoiles ont été obtenues :
De plus, Musk a également déclaré :
Twitter mettra à jour l'algorithme de recommandation en fonction des suggestions des utilisateurs toutes les 24 à 48 heures.
À ce stade, le vrai visage de ce grand algorithme qui prétend faire des recommandations à partir de 500 millions de tweets chaque jour a enfin été révélé.
À quoi ressemble l’algorithme de recommandation de Twitter ?
Selon les rapports, le système de recommandation de Twitter est basé sur un ensemble de modèles et de fonctions de base qui peuvent extraire des informations potentielles à partir des tweets, des utilisateurs et des données d'interaction.
Le rôle de ces modèles est de répondre à des questions importantes sur le réseau Twitter, telles que « Quelle est la probabilité que vous interagiez avec un autre utilisateur dans le futur » ou « Quelles communautés existe-t-il sur Twitter et quelles sont leurs communautés ? » tendances des tweets ?"
Si vous pouvez répondre à ces questions avec précision, vous pouvez laisser Twitter fournir des recommandations plus pertinentes.
Le système de recommandation de Twitter se compose de trois parties :
- Obtenez les meilleurs tweets de différentes sources de recommandation, ce processus est appelé sources candidates.
- Utilisez des modèles d'apprentissage automatique pour classer chaque tweet.
- Appliquez des heuristiques et des filtres, tels que le filtrage des tweets des utilisateurs bloqués, du contenu NSFW et des tweets vus.
Le service responsable de la construction et de la livraison de la timeline "For You" s'appelle "Home Mixer".
"Home Mixer" est construit sur "Product Mixer", un framework Scala personnalisé qui permet de créer des flux dynamiques de contenu.
Ce service sert d'épine dorsale au logiciel, connectant différentes sources de candidats, fonctions de notation, heuristiques et filtres.
Sources de candidats
Twitter utilise plusieurs sources de candidats pour récupérer des tweets récents et pertinents pour les utilisateurs.
Pour chaque demande, Twitter essaie d'extraire les 1 500 meilleurs tweets d'un pool de centaines de millions de tweets via ces sources.
Trouvez des candidats parmi les personnes que vous suivez (réseau interne) et celles que vous ne suivez pas (réseau externe).
Aujourd'hui, la timeline « Recommandé pour vous » est composée en moyenne de 50 % de tweets du réseau interne et de 50 % de tweets du réseau externe (même si cela peut varier d'un utilisateur à l'autre).
In-Network Source
In-Network Source est la plus grande source de candidats et vise à fournir les tweets les plus pertinents et les plus récents aux utilisateurs que vous suivez.
Il utilise un modèle de régression logistique pour classer efficacement les tweets des personnes que vous suivez, en fonction de leur pertinence. Les tweets les mieux classés sont ensuite envoyés à l'étape suivante.
L'élément le plus important du classement des tweets du réseau interne est le Real Graph.
Real Graph est un modèle utilisé pour prédire la probabilité d'interaction entre deux utilisateurs. Plus le score Real Graph entre l’utilisateur et l’auteur du tweet est élevé, plus leurs tweets seront inclus.
Les sources Web internes ont récemment fait l’objet de recherches sur Twitter. Twitter a récemment cessé d'utiliser le service Fanout, un service vieux de 12 ans qu'il utilisait pour diffuser les tweets de son réseau interne à partir du cache de tweets de chaque utilisateur.
Sources hors réseau
Trouver des tweets pertinents en dehors du réseau d'un utilisateur est un problème délicat.
Car si vous ne suivez pas l’auteur, comment savoir si un tweet vous concerne ?
À cette fin, Twitter a adopté deux approches pour résoudre ce problème.
L’un est le graphique social.
Cette méthode consiste à estimer ce que vous trouverez pertinent en analysant les activités des personnes que vous suivez ou qui ont des intérêts similaires.
Parcourez principalement le graphique des participants et suivez les étapes ci-dessous pour répondre aux questions suivantes :
- Qu'ont récemment publié les personnes que je suis sur Twitter ?
- Qui aime les tweets similaires comme moi et qu’ont-ils aimé d’autre récemment ?
L'équipe génère des tweets de candidats en fonction des réponses à ces questions et utilise un modèle logit pour classer les tweets résultants.
Ce type de parcours de graphiques est essentiel pour les recommandations de réseaux externes ; l'équipe a développé GraphJet, un moteur de traitement de graphiques qui maintient un graphique d'interaction en temps réel entre les utilisateurs et les tweets, pour effectuer ces parcours.
Bien que cette heuristique pour rechercher l'engagement sur Twitter et suivre les réseaux se soit avérée utile, l'approche spatiale intégrée est devenue une plus grande source de tweets provenant de réseaux externes.
Le deuxième est Embedding Spaces.
L'approche spatiale intégrée vise à répondre à une question plus générale sur la similarité du contenu : quels tweets et quels utilisateurs partagent mes intérêts ?
Les intégrations fonctionnent en générant une représentation numérique des intérêts des utilisateurs et du contenu des tweets. La similarité entre deux utilisateurs, tweets ou paires utilisateur-tweet dans cet espace d'intégration peut ensuite être calculée.
Cette similarité peut être utilisée comme substitut à la corrélation tant qu'une intégration précise est générée.
L'un des espaces d'intégration les plus utiles de Twitter est SimClusters.
SimClusters utilise un algorithme de factorisation matricielle personnalisé pour découvrir des communautés ancrées par un groupe d'utilisateurs influents (145 000 communautés, mises à jour toutes les trois semaines).
Les utilisateurs et les tweets sont représentés dans les espaces communautaires et peuvent appartenir à plusieurs communautés. La taille de la communauté varie de quelques milliers d'utilisateurs dans des groupes d'amis personnels à des centaines de millions d'utilisateurs dans l'actualité ou la culture pop :
...
Pour plus de détails, veuillez cliquer sur le lien à la fin de l'article~
One More Thing
L'algorithme de Twitter est open source, et les internautes rapides... ont commencé à résumer comment devenir un grand V basé sur l'algorithme :
Le rapport entre le nombre de personnes que vous suivez et le nombre de personnes qui vous suivent est très important, et l'abonnement à TwitterBlue joue un certain rôle... …
Lien de référence :
[1]https://www.php.cn/link /ce2b9a26bddc32cba5af69372ee14c00
[2]https://www.php .cn/link/e55bc0255c752d1cb05da10c0f1f5026
[3]https://www.php.cn/link /10fe8dc69a0964edc16fed1a1bd55716
[4]https:// www.php .cn/link/51f4efbfb3e18f4ea053c4d3d282c4e2
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

Le développement rapide de la technologie blockchain a entraîné la nécessité d'outils analytiques fiables et efficaces. Ces outils sont essentiels pour extraire des informations précieuses des transactions de blockchain afin de mieux comprendre et capitaliser sur leur potentiel. Cet article explorera certains des principaux outils d'analyse des données de la blockchain sur le marché, y compris leurs capacités, avantages et limitations. En comprenant ces outils, les utilisateurs peuvent obtenir les informations nécessaires pour maximiser les possibilités de la technologie de la blockchain.

Le cône lumineux de Huang Quan peut augmenter efficacement les dégâts critiques et la puissance d'attaque du personnage au combat. Les cônes lumineux recommandés par Huang Quan sont : Marcher sur le rivage qui passe, Bonne nuit et Visage endormi, La pluie continue de tomber, Attendez simplement et Détermination comme des perles. of Sweat Shine, ci-dessous, l'éditeur vous apportera des recommandations pour le cône de lumière souterrain du chemin de fer Collapsed Star Dome. Recommandation du cône lumineux de Huangquan 1. Marcher sur la rive qui passe 1. L'arme spéciale de Huangquan peut augmenter les dégâts explosifs. Attaquer l'ennemi peut mettre l'ennemi dans un état de bulle négatif, ce qui augmente les dégâts causés. Les dégâts du coup final sont en outre augmentés. . Il y a à la fois des états négatifs et Les dégâts sont augmentés, il faut dire que c'est une arme spéciale. 2. Le cône lumineux exclusif est tout à fait unique parmi de nombreux cônes lumineux éthérés. Il augmente directement les dégâts directs, provoque des dégâts élevés et améliore l'attribut de dégâts critiques. 3. De plus, le cône lumineux produit également un effet de statut négatif, ce qui peut faire réagir Huangquan lui-même.

La couche inférieure de la fonction de tri C++ utilise le tri par fusion, sa complexité est O(nlogn) et propose différents choix d'algorithmes de tri, notamment le tri rapide, le tri par tas et le tri stable.

01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection

1. Contexte de la construction de la plateforme 58 Portraits Tout d'abord, je voudrais partager avec vous le contexte de la construction de la plateforme 58 Portraits. 1. La pensée traditionnelle de la plate-forme de profilage traditionnelle ne suffit plus. La création d'une plate-forme de profilage des utilisateurs s'appuie sur des capacités de modélisation d'entrepôt de données pour intégrer les données de plusieurs secteurs d'activité afin de créer des portraits d'utilisateurs précis. Elle nécessite également l'exploration de données pour comprendre le comportement et les intérêts des utilisateurs. et besoins, et fournir des capacités côté algorithmes ; enfin, il doit également disposer de capacités de plate-forme de données pour stocker, interroger et partager efficacement les données de profil utilisateur et fournir des services de profil. La principale différence entre une plate-forme de profilage d'entreprise auto-construite et une plate-forme de profilage de middle-office est que la plate-forme de profilage auto-construite dessert un seul secteur d'activité et peut être personnalisée à la demande. La plate-forme de mid-office dessert plusieurs secteurs d'activité et est complexe ; modélisation et offre des fonctionnalités plus générales. 2.58 Portraits d'utilisateurs de l'arrière-plan de la construction du portrait sur la plate-forme médiane 58

Compter semble simple, mais en pratique, c'est très difficile. Imaginez que vous êtes transporté dans une forêt tropicale vierge pour effectuer un recensement de la faune. Chaque fois que vous voyez un animal, prenez une photo. Les appareils photo numériques enregistrent uniquement le nombre total d'animaux suivis, mais vous êtes intéressé par le nombre d'animaux uniques, mais il n'y a pas de statistiques. Alors, quelle est la meilleure façon d’accéder à cette population animale unique ? À ce stade, vous devez dire : commencez à compter maintenant et comparez enfin chaque nouvelle espèce de la photo à la liste. Cependant, cette méthode de comptage courante n'est parfois pas adaptée aux informations pouvant atteindre des milliards d'entrées. Des informaticiens de l'Institut indien de statistique, UNL, et de l'Université nationale de Singapour ont proposé un nouvel algorithme : le CVM. Il peut approximer le calcul de différents éléments dans une longue liste.

Auteur | Évalué par Wang Hao | L'application Chonglou News est un moyen important pour les gens d'obtenir des sources d'informations dans leur vie quotidienne. Vers 2010, les applications d'information étrangères populaires comprenaient Zite et Flipboard, tandis que les applications d'information nationales populaires étaient principalement les quatre principaux portails. Avec la popularité des produits de recommandation d'actualités d'une nouvelle ère représentés par Toutiao, les applications d'actualités sont entrées dans une nouvelle ère. Quant aux entreprises technologiques, quelle qu'elles soient, tant qu'elles maîtrisent la technologie sophistiquée des algorithmes de recommandation d'actualités, elles auront fondamentalement l'initiative et la voix au niveau technique. Aujourd'hui, jetons un coup d'œil à un article du RecSys2023 Best Long Paper Nomination Award : GoingBeyondLocal:GlobalGraph-EnhancedP.
