ポアソン行列分解: データなしでレコメンデーション システムのコールド スタート問題を解決する行列分解アルゴリズム
著者 | Wang Hao
査読者 | Sun Shujuan
レコメンデーション システムは、インターネット業界で最も人気のあるテクノロジーの 1 つです。過去 10 年間、インターネット業界は何百万もの反復バージョンの推奨システム モデルを作成してきました。さまざまなシナリオに最適化されたレコメンデーション システム モデルは数多くありますが、古典的なモデルはほとんどありません。行列分解は、レコメンデーション システムの分野の黎明期に登場し、Netflix の競争で頭角を現したレコメンデーション システム アルゴリズムであり、過去 10 年間で最も成功したレコメンデーション システム アルゴリズムでもあります。 2023 年の現在、レコメンデーション システムの分野は長らくディープ ラーニングによって独占されてきましたが、行列分解は依然として大手企業の研究開発プロセスで広く使用されており、関連するアルゴリズムに取り組んでいる科学研究者も依然として数多くいます。
行列因数分解アルゴリズムに関する最も古典的な論文は、2007 年の確率的行列因数分解です。これに基づいて、後の世代は、2021 年の RankMat (論文ダウンロード アドレス: https://arxiv.org/abs/2204.13016)、ZeroMat (論文ダウンロード アドレス: https://arxiv. org /abs/2112.03084)、2022 年の DotMat (論文のダウンロード アドレス: https://arxiv.org/abs/2206.00151)、KL-Mat (論文のダウンロード アドレス: https://arxiv.org/abs/2204.13583/ コードのダウンロード)アドレス:https://github.com/haow85/KL-Mat)などレコメンデーション システムは、そのシンプルさ、使いやすさ、スピードの速さから、インターネット業界のエンジニアに深く愛されています。
レコメンデーション システムのコールド スタート問題は、今年多くの注目を集めたもう 1 つの研究ホットスポットです。レコメンデーション システムを解決するための多くの実践者のアイデアは、転移学習とメタ学習です。しかし、このアイデアには致命的な欠陥があります。それは、他の知識分野からのデータが必要であるということです。多くの企業はこの条件を満たしていません。実際にはデータを必要としないコールド スタート アルゴリズムは、2021 年に ZeroMat が提案された後に登場しました。代表的なアルゴリズムとしては、前節で述べた ZeroMat や DotMat などがあります。この記事で紹介するポアソン行列分解アルゴリズム(PoissonMat)は、2022年の国際学術会議MLISE 2022で発表された論文です。論文の名前は、「PoissonMat: Remodeling Matrix Factorization using Poisson Distribution and Solving the Cold Start 問題を入力データなしで解決する」です (論文のダウンロード アドレス: https://arxiv.org/abs/2212.10460)。
まず、確率的行列因数分解の MAP 定義を確認しましょう:
次に、項目をスコアリングするユーザーの行動を MAP として定義します。ゆるく配布されています。ポアソン分布の定義によれば、次の式が得られます。
ポアソン式のパラメータの定義によれば、次のとおりです。
Zipf 分布によると、次の式を取得できます:
上記の式に基づいて、ポアソン行列分解 (PoissonMat) の解析形式を取得します。
確率的勾配降下法アルゴリズムを使用して、上記の式を解くと、次のアルゴリズム フローが得られます。
著者は、MovieLens 100 万データセットでアルゴリズムの精度と公平性の実験的な比較を実施しました。および LDOS-CoMoDa データセット:
図 1 ポアソン行列分解の比較実験MovieLens で 100 万件のデータセット
図 2 LDOS-CoMoDa データセットのポアソン行列分解の比較実験
実験的な比較結果によれば、次の結論を導き出すことができます。 : ポアソン行列因数分解 (PoissonMat) は、精度と公平性の両方の指標において他のアルゴリズムよりも優れています。賞賛に値するのは、ポアソン行列分解アルゴリズムが入力データを一切使用せず、完全なゼロショット学習アルゴリズムであるため、コールド スタート問題をうまく解決できることです。
最後に、著者は 16G RAM と Intel Core i5 を搭載した Lenovo 家庭用ノートブックで実験を行いました。アルゴリズムは非常に高速に実行され、実装は非常に簡単です。
レコメンデーション システムのコールド スタート問題を解決することを目的としたゼロショット学習アルゴリズムは、現在研究のホットスポットです。 2021 年の ZeroMat アルゴリズムから始まる、ゼロショット学習問題を解くためにデータを必要としない真のゼロショット学習アルゴリズム。この記事で紹介したポアソン行列分解アルゴリズム (PoissonMat) は、ZeroMat およびその後継アルゴリズム DotMat よりも優れたパフォーマンスを発揮し、現在この分野で最高のアルゴリズムの 1 つです。関連する研究はまだ初期段階にあるため、大多数の科学技術関係者の注目と注目を集めることが期待されます。
著者紹介
Wang Hao、Funplus人工知能研究所の元所長、恒昌理通ビッグデータ部門の元所長。米国ユタ大学を学士号(2008年)、修士号(2010年)を取得して卒業。国際商経大学非常勤MBA(2016年)。レコメンデーション システム (公平性/シナリオベースの推奨/コールド スタート/解釈可能性/ランキング学習)、コンピュータ グラフィックス (幾何学的モデリング/視覚化)、自然言語処理 (産業での実装アプリケーション)、リスク管理と不正行為対策 (金融/医療)長年の経験と独自の洞察を備えたその他の方向性。彼は、インターネット (Douban、Baidu、Sina、NetEase など)、金融テクノロジー (Hengchang Litong)、およびゲーム会社 (Funplus など) でテクノロジーの研究開発と管理に 12 年間の経験を持っています。国際学会やジャーナルに30本の論文を発表し、国際会議最優秀論文賞/最優秀論文レポート賞を3回受賞(IEEE SMI 2008 Best Paper Award/ICBDT 2020 Best Oral Presentation Award/ICISCAE 2021 Best Oral Presentation Award)。 2006 年 ACM/ICPC 北米ロッキーマウンテン地域大会金メダル。 2004 年全国大学英語能力コンテストのスピーキング決勝で銅メダル。 2003年、済南大学入学試験の理工英語部門で1位を獲得した。
以上がポアソン行列分解: データなしでレコメンデーション システムのコールド スタート問題を解決する行列分解アルゴリズムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

1. 問題の背景: コールド スタート モデリングの必要性と重要性 コンテンツ プラットフォームとして、Cloud Music には毎日大量の新しいコンテンツがオンラインにあります。クラウド音楽プラットフォーム上の新しいコンテンツの量は、ショートビデオなどの他のプラットフォームに比べて比較的少ないですが、実際の量は皆の想像をはるかに超えている可能性があります。同時に、音楽コンテンツは、短いビデオ、ニュース、製品の推奨とは大きく異なります。音楽のライフサイクルは非常に長期間に及び、多くの場合、数年単位で測定されます。曲によっては数か月、数年眠っていた後に爆発することもありますし、名曲は10年以上経ってもなお強い生命力を持っていることもあります。したがって、音楽プラットフォームのレコメンドシステムでは、他のカテゴリをレコメンドすることよりも、人気のないロングテールの高品質コンテンツを発見し、適切なユーザーにレコメンドすることが重要です。

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

上記と著者の個人的な理解は、自動運転システムにおいて、認識タスクは自動運転システム全体の重要な要素であるということです。認識タスクの主な目的は、自動運転車が道路を走行する車両、路側の歩行者、運転中に遭遇する障害物、道路上の交通標識などの周囲の環境要素を理解して認識できるようにすることで、それによって下流のシステムを支援できるようにすることです。モジュール 正しく合理的な決定と行動を行います。自動運転機能を備えた車両には、通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなど、さまざまな種類の情報収集センサーが装備されており、自動運転車が正確に認識し、認識できるようにします。周囲の環境要素を理解することで、自動運転車が自動運転中に正しい判断を下せるようになります。頭
