アリババの説明可能な推奨アルゴリズムの適用
1. おすすめビジネスのご紹介
まずは、アリババヘルスの事業背景と現状分析をご紹介します。
1. レコメンドシーンの表示
例えば、Dangdang では下図のように、解釈可能なレコメンドが表示されます。 com の「閲覧した製品に基づく推奨」(推奨の理由をユーザーに伝える)、タオバオの「1000 のホーム コントロール コレクション」と「2000 のデジタル エキスパートが購入を追加」はすべて説明可能な推奨であり、ユーザー情報を提供することで推奨製品の理由を説明します。 。
左側の図の説明可能な推奨事項には、比較的単純な実装アイデアが含まれています。推奨事項には主にリコールとソート 2 つの主要なモジュールがあり、リコールにはマルチチャンネルのリコールが含まれることが多く、ユーザーの行動のリコールも一般的なリコール方法です。ソートモジュールを通過した製品を判定することができ、ユーザー行動想起プールからの製品であれば、推奨製品の後に対応する推奨コメントを追加することができます。しかし、この方法は精度が低いことが多く、ユーザーにあまり有効な情報を提供できません。
これと比較して、右側の例では、対応する説明テキストにより、製品カテゴリ情報などのより多くの情報をユーザーに提供できますが、この方法では、多くの場合、機能からテキストに至るまで、より多くの手動介入が必要になります。出力リンクは手動で処理されます。
Ali Health に関しては、業界の特殊性により、他のシナリオよりも多くの制限がある可能性があります。関連法規では、「3品1機器」(医薬品、健康食品、特定医療用配合食品、医療機器)の広告に「売れ筋、ランキング、推奨」などの文字情報を掲載することはできないと規定している。したがって、アリババヘルスは、上記の規制を遵守することを前提として、アリババヘルスの事業に基づいた製品を推奨する必要があります。
2. Ali Health の経営状況
Ali Health には現在、Ali Health 自営店舗と Ali Health の 2 種類の店舗があります。業界の店舗。その中で、自営店舗には主に大型薬局、海外店舗、医薬品旗艦店が含まれますが、アリの健康産業店舗には主に旗艦店とさまざまなカテゴリーの個人店が含まれます。
#製品に関しては、Alibaba Health は主に、従来型商品、OTC 商品、処方薬という 3 つの主要カテゴリの製品をカバーしています。通常商品は医薬品ではない商品と定義されており、通常商品のおすすめには、カテゴリの売上トップ、n 人以上が収集/購入しているなど、より多くの情報が表示されます。 OTC 薬や処方薬などの医薬品の推奨事項は、対応する規制の対象となり、推奨事項は、機能的適応、投薬サイクル、禁忌、その他の情報など、ユーザーの懸念事項とより統合される必要があります。
医薬品の推奨テキストに使用できる上記の情報は、主に次の主要な情報源から得られます:
- 製品レビュー (処方薬を除く)。
- #製品詳細ページ。
- 手順およびその他の情報。
後半では主に 製品の特徴を紹介します を抽出してエンコードする方法。
1. 製品の特徴の抽出以下は、火翔正斉水を例として、製品の特徴を抽出する方法を示します。主要な特徴を抽出するための上記のデータ ソースからの特徴:
- #Title
OCR 技術は、製品 詳細画像から、製品の機能、主なセールスポイント、コアセールスポイントなど、より包括的な製品情報を抽出できます。 ユーザー別、特定の機能 感情スコアを使用して、商品の対応するキーワードの重み付けおよび重み付けを減らすことができます。たとえば、「熱中症を防ぐ」Huoxiang Zhengqi Water の場合、対応するラベルは、ユーザー コメントの「熱中症を防ぐ」という感情スコアに基づいて重み付けできます。 上記の複数のデータ ソースを通じて、情報からキーワードを抽出し、キーワード ライブラリを構築できます。抽出されたキーワードには重複と同義語が多数あるため、標準シソーラスを生成するには、同義語をマージして手動検証と組み合わせる必要があります。最後に、単一の製品とタグのリストの関係を形成でき、これをその後のコーディングやモデルでの使用に使用できます。 #2. 特徴のエンコード (1) 共通のブラウジング製品ペア: 一定期間 (30 分) 内に次々とクリックしたユーザーは、共同閲覧データとして定義されます。 共通購入は、同じメイン注文として定義できます。広義のサブオーダーとは、共同で購入する商品のペアと考えることができますが、実際のユーザーの注文習慣を考慮して、同一ユーザーが一定期間(10分)以内に注文した商品データを定義します。 (3) 閲覧後に購入した製品ペア: 同じユーザーが A をクリックした後に製品 B を購入し、A と B は相互に排他的です。データを閲覧して購入します。
#次に、特徴をエンコードする方法について説明します。特徴エンコードは主に単語埋め込み用の word2vec メソッドに基づいています。
実際の購入履歴データは、次の 3 つのカテゴリに分類できます。 特徴エンコード モデルは依然として word2vec のアイデアに基づいています。主に、類似したもの間の埋め込みが可能であることを期待しています。商品/タグが近くなります。したがって、単語埋め込みにおけるポジティブサンプルは、閲覧後に購入した上記の商品ペアとして定義され、ネガティブサンプルは、共同閲覧した商品ペアと共同購入した商品ペアの和集合から閲覧後に購入した商品ペアのデータを差し引いたものとなります。
(1) 機能は製品の特性のみを使用するため、コールド問題を完全に解決できます。起動時の問題: 新しく発売された製品の場合でも、タイトル、製品の詳細、その他の情報から対応するタグを取得できます。
(2) ポジティブサンプルとネガティブサンプルの定義は、さまざまな推奨シナリオで使用できます。ポジティブサンプルが共同購入した製品のペアとして定義されている場合、トレーニングされた製品の埋め込みを「コロケーション購入推奨」で使用できます。 " シナリオ。3. 説明可能な推奨モデル
1. 説明可能なモデルの背景紹介
業界は現在、比較的成熟しています。解釈可能な型には主に、組み込みの解釈可能性 (モデル固有) とモデルに依存しない解釈可能性 (モデル非依存) が含まれます。
一般的な XGBoost などの解釈可能モデルが組み込まれています。ただし、XGBoost はエンドツーエンドのモデルですが、その機能の重要性はデータセット全体に基づいており、パーソナライズされた推奨事項を満たしていません。 「何千もの人々と何千もの顔」が必要です。
モデル非依存の解釈可能性とは、主に論理シミュレーション モデルを再構築し、単一のケースを分析して予測値が実際の値と異なる理由を判断できる SHAP などのモデルを説明することを指します。ただし、SHAP は複雑で時間がかかり、パフォーマンス変更後のオンライン パフォーマンス要件を満たすことができません。
したがって、各サンプルの特徴重要度を出力できるエンドツーエンドのモデルを構築する必要があります。
混合ガウス分布は複数のガウス分布を組み合わせたもので、特定の分布の結果値と各サンプル結果が特定の分布に属する確率を出力できます。 。したがって、分類された特徴を異なる分布を持つデータとして理解し、対応する特徴の予測結果と実際の結果における予測の重要性をモデル化するための類推を行うことができます。
2. モデル構造図
次の図は全体的なモデル構造図です。左の図は選択されたモデルであり、機能の重要度を表示するために使用できます。 . 右の図は、特徴量に対応する予測モデルです。
具体的には、予測モデルは対応する機能予測/クリックの確率を予測するために使用され、選択モデルはどの機能分布がより重要であり、どの機能分布がより重要であるかを説明するために使用されます。説明として使用 性的なテキストの表示。
3. 予測モデル
次の図は、予測モデルの結果を示しています. 予測モデルは主に DeepFM のアイデアを利用しており、ディープ モデルとクロスモデル。ディープ モデルは主にフィーチャの深い表現を学習するために使用され、クロス モデルはクロスフィーチャを学習するために使用されます。
ディープ モデルでは、まず機能が事前にグループ化されます (合計 N 個のグループがあると仮定します)。たとえば、価格、カテゴリ、その他の関連する機能が価格にマージされます。 、カテゴリ カテゴリ (図のフィールド フィールド)、特徴のセットごとに個別のモデル トレーニングを実行し、この特徴のセットに基づいてモデルの結果を取得します。
モデルを事前にマージおよびグループ化すると、次の 2 つの利点があります。
(1) N 個のモデルの独立したトレーニングを通じて、入力特徴量を増減することでモデルの複雑さを変更できます。これはオンラインのパフォーマンスに影響します。
(2) フィーチャを結合およびグループ化すると、フィーチャの規模が大幅に減少するため、フィーチャ ドメインを手動でテキストに変換することがより便利になります。
アテンション層は理論的には特徴の重要性を分析するために使用できることは言及しておく価値がありますが、このモデルにアテンションを導入しない主な理由は次のとおりです。
(1) アテンションが使用済みレイヤーを前に置きすぎると、特徴を深く表現した結果を反映できません;
(2) 注目レイヤーを後ろに置きすぎると、特徴を深く表現した結果を反映することができません元に戻ってコア機能を見つけます。
予測モデルについて:
クロスレイヤーは FM モデルに従いませんが、CNN を使用して DeepFM の FM 構造を置き換えます。 FM モデルは、特徴量のペアワイズ クロス結果を学習し、計算中の次元爆発を避けるために数式を通じて直接ペアワイズ クロス結果を計算しますが、特徴量の重要性を追跡することが不可能になるため、クロス モデルに CNN が導入されています。元の構造を置き換えます: N 特徴が交差するように特徴が乗算され、その後、CNN の対応する操作が実行されます。これにより、入力後のプーリングや連結などの操作を経て、特徴量を遡ることができます。
上記の利点に加えて、この方法には別の利点もあります。現在のバージョンでは 1 つの機能を 1 つの説明テキストに変換するだけですが、依然として、複数の機能のインタラクションの変換を達成することが期待されています。未来。たとえば、ユーザーが 100 元の低価格製品を購入することに慣れているが、元の価格が 50,000 元の製品が 500 元に割引されてその製品を購入した場合、モデルはそのユーザーを高品位であると定義する可能性があります。 -浪費ユーザー。ただし、実際には、ユーザーはハイエンドブランドと高い割引という二重の要因によって注文する可能性があるため、組み合わせロジックを考慮する必要があります。 CNN-FM モデルの場合、特徴マップを直接使用して、後の段階で特徴の組み合わせを出力できます。
4. 選択モデル
選択モデルは MLP と sparseMax で構成されます。選択モデルの活性化関数は、より一般的なソフトマックスではなくスパースマックスであることに言及する価値があります。画像の右側には、sparsemax の関数定義と、softmax と sparsemax の関数比較表が表示されます。
右下の図からわかるように、ソフトマックスは依然として重要度の低い出力ノードに小さな値を割り当てます。このシナリオでは、特徴の次元が爆発的に増加します。機能間の出力は区別できません。 SparseMax は出力を離散化し、最終的にはより重要な特徴のみを出力できます。
4. 実験効果の表示
1. 実験データの説明
オンライン効果データは主に大手薬局のホームページにある露出-クリックデータから取得していますが、過学習を避けるために他のシーンの露出-クリックデータも導入しており、データ比率は4:1です。
2. オフライン指標
オフライン シナリオでは、このモデルの AUC は 0.74 です。
3. オンライン インジケーター
オンライン シーンにはすでに CTR モデルがあるため、新しいバージョンのアルゴリズムは単にそのモデルを置き換えるだけではないことを考慮してください。説明テキストは変数を制御しないため、この実験では AB テストを直接使用しませんでした。代わりに、オンライン CTR モデルと新しいバージョンのアルゴリズムの予測値が特定のしきい値より高い場合にのみ、推奨理由のテキストが表示されます。オンライン化後、新しいアルゴリズムの PCTR は 9.13% 増加し、UCTR は 3.4% 増加しました。
5. 質疑応答セッション
Q1: 標準語彙の生成と同義語のマージにはどのようなモデルが使用されていますか?効果はどうですか?手動による校正作業はどれくらい必要ですか?
#A1: 同義語がマージされると、モデルはテキスト標準を学習し、基本的な語彙ライブラリを提供するために使用されます。しかし実際には、手動による検証の方が大きな割合を占めます。健康/医薬品のビジネス シナリオでは、アルゴリズムの精度に対する要件がより高いため、個々の単語の逸脱により、実際の意味に大きな逸脱が生じる可能性があります。全体として、手動による検証の割合はアルゴリズムによる検証の割合よりも大きくなります。
#Q2: LIME モデルは推奨モデルの説明として使用できますか?
#A2: はい。説明可能な推奨事項を実行できるモデルは他にもたくさんあります。共有者は一般に GMM に精通しているため、上記のモデルが選択されました。
#Q3: 選択モデルと予測モデルはどのように連携されていますか?A3: N セットの特徴グループがあると仮定すると、予測モデルと選択モデルの両方が 1*N 次元のベクトルを生成し、最終的に予測モデルと選択モデルを比較し、乗算(複数)して連携させます。 #Q4: 解釈可能なテキストを生成するにはどうすればよいですか?
#A
#4: 現在、テキスト生成に適した機械学習モデルはなく、主に手動による方法が使用されています。ユーザーが価格を重視する場合、過去のデータを分析し、コストパフォーマンスの高い製品を推奨するでしょう。しかし今のところ、それは主に手作業です。将来的にはテキスト生成に適したモデルが登場することが期待されていますが、ビジネス シナリオの特殊性を考慮すると、モデルによって生成されたテキストは依然として手動で検証する必要があります。 Q5: モデルのフィルタリング ロジックは何ですか?
A5: GMM 中性子分布の選択では、分布は主に GMM の Mk を通じて学習され、Mk の高値と低値に基づいてフィルタリングされます。
#Q6: 語彙の注釈に属性タイプはありますか?
A6: 商品説明文中の疾患、機能、タブーなどの属性語の基準を満たしていること。
#A7: はい、現在の実際の使用状況はスロットを埋めることです。 Q7: 解釈可能なテキストでは、スロット充填のアイデアを使用できますか?つまり、異なるテンプレートを用意し、言葉の重みに応じて異なるテンプレートを選択するということでしょうか。
以上がアリババの説明可能な推奨アルゴリズムの適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

1. マルチモーダル大型モデルの発展の歴史 上の写真は、1956 年に米国のダートマス大学で開催された最初の人工知能ワークショップです。このカンファレンスが人工知能開発の始まりとも考えられています。記号論理学の先駆者たち(前列中央の神経生物学者ピーター・ミルナーを除く)。しかし、この記号論理理論は長い間実現できず、1980 年代と 1990 年代に最初の AI の冬の到来さえもたらしました。最近の大規模な言語モデルが実装されて初めて、ニューラル ネットワークが実際にこの論理的思考を担っていることがわかりました。神経生物学者ピーター ミルナーの研究は、その後の人工ニューラル ネットワークの開発に影響を与えました。彼が参加に招待されたのはこのためです。このプロジェクトでは。

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

上記と著者の個人的な理解は、自動運転システムにおいて、認識タスクは自動運転システム全体の重要な要素であるということです。認識タスクの主な目的は、自動運転車が道路を走行する車両、路側の歩行者、運転中に遭遇する障害物、道路上の交通標識などの周囲の環境要素を理解して認識できるようにすることで、それによって下流のシステムを支援できるようにすることです。モジュール 正しく合理的な決定と行動を行います。自動運転機能を備えた車両には、通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなど、さまざまな種類の情報収集センサーが装備されており、自動運転車が正確に認識し、認識できるようにします。周囲の環境要素を理解することで、自動運転車が自動運転中に正しい判断を下せるようになります。頭
