Musks „Open-Source-Verpflichtung“ ist endlich wahr geworden.
Gerade hat Musk offiziell angekündigt:
Die meisten (Twitters) Empfehlungsalgorithmen werden heute Open Source sein, der Rest wird folgen.
Und Musk zeigte sofort die Adresse des Quellcodes des Twitter-Empfehlungsalgorithmus auf GitHub.
In nur wenigen Stunden wurden Zehntausende Sterne gewonnen:
Darüber hinaus sagte Musk auch:
Twitter wird den Empfehlungsalgorithmus alle 24 bis 48 Stunden basierend auf Benutzervorschlägen aktualisieren.
An diesem Punkt wurde endlich das wahre Gesicht dieses großen Algorithmus enthüllt, der behauptet, täglich Empfehlungen aus 500 Millionen Tweets zu geben.
Berichten zufolge basiert das Empfehlungssystem von Twitter auf einer Reihe von Kernmodellen und -funktionen, die potenzielle Informationen aus Tweets, Nutzern und Interaktionsdaten extrahieren können.
Die Rolle dieser Modelle besteht darin, wichtige Fragen im Twitter-Netzwerk zu beantworten, wie zum Beispiel: „Wie hoch ist die Wahrscheinlichkeit, dass Sie in Zukunft mit einem anderen Benutzer interagieren werden?“ oder „Welche Communities gibt es auf Twitter und welche sind das?“
Wenn Sie diese Fragen genau beantworten können, können Sie Twitter relevantere Empfehlungen geben lassen.
Das Empfehlungssystem von Twitter besteht aus drei Teilen:
Der Dienst, der für die Erstellung und Bereitstellung der „Für Sie“-Timeline verantwortlich ist, heißt „Home Mixer“.
„Home Mixer“ basiert auf „Product Mixer“, einem benutzerdefinierten Scala-Framework, das beim Aufbau dynamischer Inhaltsflüsse hilft.
Dieser Dienst dient als Software-Rückgrat und verbindet verschiedene Kandidatenquellen, Bewertungsfunktionen, Heuristiken und Filter.
Twitter nutzt mehrere Kandidatenquellen, um aktuelle und relevante Tweets für Benutzer abzurufen.
Für jede Anfrage versucht Twitter, über diese Quellen die besten 1500 Tweets aus einem Pool von Hunderten Millionen Tweets zu ziehen.
Finden Sie Kandidaten von Personen, denen Sie folgen (internes Netzwerk) und von Personen, denen Sie nicht folgen (externes Netzwerk).
Heutzutage besteht die Timeline „Für Sie empfohlen“ im Durchschnitt aus 50 % internen Netzwerk-Tweets und 50 % externen Netzwerk-Tweets (obwohl dies je nach Benutzer variieren kann).
In-Network Source ist die größte Kandidatenquelle und zielt darauf ab, den Benutzern, denen Sie folgen, die relevantesten und neuesten Tweets bereitzustellen.
Es verwendet ein logistisches Regressionsmodell, um Tweets von Personen, denen Sie folgen, basierend auf ihrer Relevanz effizient zu bewerten. Die Tweets mit dem höchsten Rang werden dann an die nächste Stufe weitergeleitet.
Die wichtigste Komponente beim Ranking interner Netzwerk-Tweets ist der Real Graph.
Real Graph ist ein Modell zur Vorhersage der Wahrscheinlichkeit einer Interaktion zwischen zwei Benutzern. Je höher der Real Graph-Score zwischen dem Benutzer und dem Tweet-Autor ist, desto mehr Tweets werden darin enthalten.
Interne Webquellen waren kürzlich Gegenstand der Recherche von Twitter. Twitter hat kürzlich die Nutzung des Fanout-Dienstes eingestellt, eines 12 Jahre alten Dienstes, mit dem das Unternehmen Tweets aus seinem internen Netzwerk aus dem Tweet-Cache jedes Benutzers bereitstellte.
Das Auffinden relevanter Tweets außerhalb des Netzwerks eines Benutzers ist ein kniffliges Problem.
Denn wenn Sie dem Autor nicht folgen, woher wissen Sie dann, ob ein Tweet für Sie relevant ist?
Zu diesem Zweck hat Twitter zwei Ansätze gewählt, um dieses Problem zu lösen.
Einer ist der Social Graph.
Mit dieser Methode können Sie abschätzen, was Sie relevant finden, indem Sie die Aktivitäten von Personen analysieren, denen Sie folgen oder die ähnliche Interessen haben.
Durchsuchen Sie hauptsächlich die Teilnehmergrafik und befolgen Sie die folgenden Schritte, um die folgenden Fragen zu beantworten:
Das Team generiert Kandidaten-Tweets basierend auf den Antworten auf diese Fragen und verwendet ein Logit-Modell, um die resultierenden Tweets zu bewerten.
Diese Art der Graph-Durchquerung ist für externe Netzwerkempfehlungen unerlässlich; das Team hat GraphJet entwickelt, eine Graph-Verarbeitungs-Engine, die ein Echtzeit-Interaktionsdiagramm zwischen Benutzern und Tweets verwaltet, um diese Durchquerungen durchzuführen.
Während sich diese Heuristik für die Suche nach Twitter-Engagement und das Verfolgen von Netzwerken als nützlich erwiesen hat, ist der eingebettete räumliche Ansatz zu einer größeren Quelle für Tweets aus externen Netzwerken geworden.
Das zweite ist das Einbetten von Leerzeichen.
Der eingebettete räumliche Ansatz zielt darauf ab, eine allgemeinere Frage zur Inhaltsähnlichkeit zu beantworten: Welche Tweets und Benutzer teilen meine Interessen?
Einbettungen funktionieren, indem sie eine digitale Darstellung der Benutzerinteressen und Tweet-Inhalte generieren. Anschließend kann die Ähnlichkeit zwischen zwei beliebigen Benutzern, Tweets oder Benutzer-Tweet-Paaren in diesem Einbettungsraum berechnet werden.
Diese Ähnlichkeit kann als Ersatz für die Korrelation verwendet werden, solange eine genaue Einbettung erzeugt wird.
Einer der nützlichsten Einbettungsbereiche von Twitter ist SimClusters.
SimClusters verwendet einen benutzerdefinierten Matrixfaktorisierungsalgorithmus, um Communities zu entdecken, die von einer Gruppe einflussreicher Benutzer verankert sind (145.000 Communities, alle drei Wochen aktualisiert).
Benutzer und Tweets werden in Community-Bereichen dargestellt und können mehreren Communities angehören. Die Größe der Community reicht von einigen Tausend Nutzern in persönlichen Freundesgruppen bis hin zu Hunderten Millionen Nutzern in der Nachrichten- oder Popkultur:
...
Für weitere Details klicken Sie bitte auf den Link am Ende des Artikels~
Der Algorithmus von Twitter ist Open Source, und schnelle Internetnutzer ... haben begonnen, basierend auf dem Algorithmus zusammenzufassen, wie man ein großes V wird:
Das Verhältnis der Anzahl der Personen, denen man folgt Die Anzahl der Personen, die Ihnen folgen, ist sehr wichtig, und das Abonnieren von TwitterBlue spielt eine gewisse Rolle... …
Referenzlink:
[1]https://www.php.cn/link /ce2b9a26bddc32cba5af69372ee14c00
[2]https://www.php /link /10fe8dc69a0964edc16fed1a1bd55716
[4]https:// www.php .cn/link/51f4efbfb3e18f4ea053c4d3d282c4e2
Das obige ist der detaillierte Inhalt vonDer Open-Source-Twitter-Empfehlungsalgorithmus von Musk, GitHub, erreichte in Sekundenschnelle 10.000 Sterne und versprach, sich alle 24 bis 48 Stunden weiterzuentwickeln. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!