目次
Twitter のレコメンデーション アルゴリズムはどのようなものですか?
候補ソース
ネットワーク内ソース
ネットワーク外のソース
One More Thing
ホームページ テクノロジー周辺機器 AI マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

Apr 11, 2023 pm 12:34 PM
推薦する アルゴリズム twitter

マスク氏の「オープンソースへの取り組み」がついに実現した。

たった今、マスク氏が公式に発表しました:

大部分の (Twitter の) レコメンデーション アルゴリズムが今日オープンソースになり、残りもそれに続くでしょう。

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

#そしてマスク氏はすぐに、GitHub 上の Twitter 推奨アルゴリズムのソース コードのアドレスを示しました。

わずか数時間で、数万のスターが獲得されました:

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

さらに、マスク氏は次のようにも言いました:

Push Theユーザーの提案に基づく推奨アルゴリズムは 24 ~ 48 時間ごとに更新されます。

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

#毎日 5 億件のツイートから推奨を行うと主張するこの巨大なアルゴリズムの正体が、この時点でついに明らかになりました。

Twitter のレコメンデーション アルゴリズムはどのようなものですか?

レポートによると、Twitter のレコメンデーション システムは、ツイート、ユーザー、インタラクション データから潜在的な情報を抽出できる一連のコア モデルと機能に基づいています。

これらのモデルの役割は、「将来他のユーザーと交流する可能性はどのくらいですか?」や「Twitter にはどのようなコミュニティがあるか」など、Twitter ネットワークにおける重要な質問に答えることです。

これらの質問に正確に答えることができれば、Twitter がより関連性の高いおすすめを提供できるようになります。

Twitter のレコメンデーション システムは 3 つの部分で構成されています:

  • さまざまなレコメンデーション ソースから最適なツイートを取得するこのプロセスは候補ソースと呼ばれます。
  • 機械学習モデルを使用して各ツイートをランク付けします。
  • ブロックされたユーザーからのツイート、NSFW コンテンツ、閲覧済みツイートのフィルタリングなど、ヒューリスティックとフィルターを適用します。

「For You」タイムラインの構築と配信を担当するサービスは「Home Mixer」と呼ばれます。

「Home Mixer」は、コンテンツの動的なフローの構築を支援するカスタム Scala フレームワークである「Product Mixer」の上に構築されています。

このサービスは、さまざまな候補ソース、スコアリング機能、ヒューリスティック、フィルターを接続するソフトウェア バックボーンとして機能します。

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

候補ソース

Twitter は複数の候補ソースを使用して、ユーザーに関連する最近のツイートを取得します。

Twitter はリクエストごとに、これらのソースからの数億件のツイートのプールから最適な 1,500 件のツイートを抽出しようとします。

フォローしている人 (内部ネットワーク) とフォローしていない人 (外部ネットワーク) から候補者を見つけます。

現在、「あなたへのおすすめ」タイムラインは、平均 50% が内部ネットワークのツイート、50% が外部ネットワークのツイートで構成されています (ただし、これはユーザーによって異なる場合があります)。

ネットワーク内ソース

ネットワーク内ソースは最大の候補ソースであり、これをフォローしているユーザーに最も関連性の高い最新のツイートを提供することを目的としています。

ロジスティック回帰モデルを使用して、フォローしているユーザーのツイートを関連性に基づいて効率的にランク付けします。上位にランクされたツイートは次のステージに送られます。

内部ネットワークのツイートをランク付けする最も重要なコンポーネントはリアル グラフです。

Real Graph は、2 人のユーザー間のインタラクションの可能性を予測するために使用されるモデルです。ユーザーとツイート作成者のリアル グラフ スコアが高いほど、より多くのツイートが含まれます。

最近、内部ネットワークのソースが Twitter の調査対象となっています。 Twitter は最近、各ユーザーのツイート キャッシュから内部ネットワークのツイートを提供するために使用していた 12 年間使用していた Fanout サービスの使用を停止しました。

ネットワーク外のソース

ユーザーのネットワーク外で関連するツイートを見つけるのは難しい問題です。

投稿者をフォローしていない場合、そのツイートが自分に関連しているかどうかをどうやって知ることができるのでしょうか?

この目的を達成するために、Twitter はこの問題を解決するために 2 つのアプローチを採用しました。

1 つはソーシャル グラフです。

この方法は、あなたがフォローしている人、または同様の興味を持つ人々のアクティビティを分析することによって、あなたに関連すると思われるものを推定することです。

主に参加グラフをたどって、次の手順に従って次の質問に答えます:

  • 私がフォローしている人が最近 Twitter に投稿したメッセージは何ですか?
  • 私と同じようなツイートが好きな人はいますか?彼らが最近気に入ったツイートは他にありますか?

チームは、これらの質問への回答に基づいて候補ツイートを生成し、ロジット モデルを使用して結果のツイートをランク付けしました。

このタイプのグラフ トラバーサルは、外部ネットワークの推奨事項に不可欠です。チームは、これらのトラバーサルを実行するために、ユーザーとツイートの間のリアルタイム インタラクション グラフを維持するグラフ処理エンジンである GraphJet を開発しました。

Twitter のエンゲージメントおよびアテンション ネットワークを検索するためのこのヒューリスティックは有用であることが証明されていますが、埋め込まれた空間的アプローチは、外部ネットワークからのツイートのより大きなソースとなっています。

2 つ目はスペースの埋め込みです。

埋め込まれた空間的アプローチは、コンテンツの類似性に関するより一般的な質問、つまりどのツイートやユーザーが私の興味を共有しているか、という質問に答えることを目的としています。

埋め込みは、ユーザーの興味やツイートのコンテンツのデジタル表現を生成することによって機能します。この埋め込み空間内の任意の 2 人のユーザー、ツイート、またはユーザーとツイートのペアの間の類似性を計算できます。

正確な埋め込みが生成される限り、この類似性は相関関係の代用として使用できます。

Twitter の最も便利な埋め込みスペースの 1 つは SimClusters です。

SimClusters は、カスタム行列因数分解アルゴリズムを使用して、影響力のあるユーザーのグループによって固定されたコミュニティ (145,000 のコミュニティ、3 週間ごとに更新) を検出します。

ユーザーとツイートはコミュニティ スペースに表示され、複数のコミュニティに属することができます。コミュニティの規模は、個人的な友人グループの数千ユーザーから、ニュースやポップ カルチャーの数億人までさまざまです。

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

その他の関連情報詳細については、記事の最後にあるリンクをクリックしてください~

One More Thing

Twitter のアルゴリズムはオープンソースであり、素早いネチズンは...ビッグになる方法をまとめ始めていますアルゴリズムに基づく V :

あなたをフォローしている人の数とあなたをフォローしている人の数の比率は非常に重要です。TwitterBlue の購読には一定の役割があります...

マスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束

#参考リンク:

[1]
https://www.php.cn/link/ce2b9a26bddc32cba5af69372ee14c00 [2]
https://www.php.cn /link/e55bc0255c752d1cb05da10c0f1f5026 [3]
https://www.php.cn/link/10fe8dc69a0964edc16fed1a1bd55716 [4]
https://www.php.cn/link/51f4efbfb3e18f4ea053c4d3d282c4e2

以上がマスク氏が Twitter 推奨アルゴリズムをオープンソース化、GitHub は数秒でスター数 10,000 に到達、24 ~ 48 時間ごとに進化すると約束の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

ブロックチェーンデータ分析ツールは何ですか? ブロックチェーンデータ分析ツールは何ですか? Feb 21, 2025 pm 10:24 PM

ブロックチェーンテクノロジーの急速な開発により、信頼できる効率的な分析ツールが必要になりました。これらのツールは、ブロックチェーントランザクションから貴重な洞察を抽出するために不可欠です。この記事では、能力、利点、制限など、市場にある主要なブロックチェーンデータ分析ツールのいくつかについて説明します。これらのツールを理解することにより、ユーザーはブロックチェーンテクノロジーの可能性を最大化するために必要な洞察を得ることができます。

黄泉ライトコーンの推奨事項 黄泉ライトコーンの推奨事項 Mar 27, 2024 pm 05:31 PM

Huang Quan のライト コーンは、戦闘でキャラクターのクリティカル ヒット ダメージと攻撃力を効果的に増加させることができます。Huang Quan が推奨するライト コーンは次のとおりです: 通り過ぎる岸辺を歩く、おやすみと寝顔、雨は降り続ける、ただ待つ、ビーズのような決意汗の. Shine、以下の編集者は崩壊したスタードーム鉄道のUnderworld Light Coneに関する推奨事項を提供します。黄泉ライトコーンのおすすめ 1. 渡し岸を歩く 1. 黄泉の特別な武器は爆発ダメージを増加させることができます. 敵を攻撃すると敵をバブルマイナス状態にすることができ、与えるダメージが増加します. フィニッシュムーブのダメージはさらに増加し​​ます. マイナス状態とダメージが増加する両方があり、特殊な武器と言わざるを得ません。 2. 専用のライトコーンは数あるエーテルライトコーンの中でも非常にユニークで、直接ダメージを増加させ、高いダメージを与え、クリティカルダメージ属性を向上させます。 3. それだけでなく、ライトコーンはマイナスのステータス効果も提供し、Huangquan 自体に反応を引き起こす可能性があります。

C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

グローバルグラフ強化に基づくニュース推奨アルゴリズム グローバルグラフ強化に基づくニュース推奨アルゴリズム Apr 08, 2024 pm 09:16 PM

著者 | Wang Hao によるレビュー | Chonglou ニュース アプリは、人々が日常生活で情報ソースを入手する重要な方法です。 2010年頃、海外ニュースアプリの人気はZiteやFlipboardなどがあり、国内ニュースアプリの人気は主に4大ポータルでした。 Toutiaoに代表される新時代のニュースレコメンド商品の人気により、ニュースアプリは新時代を迎えました。テクノロジー企業に関しては、どの企業であっても、高度なニュース推奨アルゴリズム技術を習得していれば、基本的に技術レベルでの主導権と発言権を握ることになる。今日は、RecSys2023 Best Long Paper Nomination Award の論文、GoingBeyondLocal:GlobalGraph-EnhancedP を見てみましょう。

画期的な CVM アルゴリズムが 40 年以上の計数の問題を解決します。コンピューター科学者がコインを投げて「ハムレット」を表す固有の単語を割り出す 画期的な CVM アルゴリズムが 40 年以上の計数の問題を解決します。コンピューター科学者がコインを投げて「ハムレット」を表す固有の単語を割り出す Jun 07, 2024 pm 03:44 PM

数を数えるのは簡単そうに思えますが、実際にやってみるととても難しいです。あなたが野生動物の個体数調査を実施するために自然のままの熱帯雨林に運ばれたと想像してください。動物を見かけたら必ず写真を撮りましょう。デジタル カメラでは追跡された動物の総数のみが記録されますが、固有の動物の数に興味がありますが、統計はありません。では、このユニークな動物群にアクセスする最善の方法は何でしょうか?この時点で、今すぐ数え始めて、最後に写真から各新種をリストと比較すると言わなければなりません。ただし、この一般的なカウント方法は、数十億エントリに達する情報量には適さない場合があります。インド統計研究所、UNL、およびシンガポール国立大学のコンピューター科学者は、新しいアルゴリズムである CVM を提案しました。長いリスト内のさまざまな項目の計算を近似できます。

See all articles