目次
3. 適用事例分析
1. 新しいユーザー シナリオの実験的評価
4. まとめ
ホームページ テクノロジー周辺機器 AI ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

Sep 29, 2023 pm 10:57 PM
アルゴリズム 実験系

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

#1. 新しいユーザー シナリオでの実験で直面する問題

1. UG パノラマ

これはUGの全景です。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

UG 顧客を獲得し、有料広告、ASO、SEO、その他のチャネルを通じてトラフィックをアプリに誘導します。次に、初心者向けの操作と指導を行って、ユーザーを活性化し、成熟段階に持っていきます。後続のユーザーは徐々に非アクティブになり、減少期に入り、さらには解約期に入る可能性があります。この期間中、離脱に対する早期警告、アクティベーションを促進するためのリコール、その後失われたユーザーに対するいくつかのリコールを行います。

は、上の図の式のように要約できます。つまり、DAU は DNU と LT の積に等しいということです。 UG シナリオのすべての作業は、この公式に基づいて分解できます。

2. AB 実験の原理

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

AB 実験の目的は、分布を完全にランダム化することです。実験グループと異なる対照グループに異なる戦略を使用して、トラフィックの分析を行います。最後に、統計的手法と実験仮説を組み合わせることによって科学的な決定が下され、実験全体の枠組みが構成されます。現在、市場には実験的プラットフォーム配布とクライアント ローカル配布の 2 種類の実験的配布があります

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

実験的プラットフォーム配布には前提条件があります。初期化完了後にデバイスが安定した ID を取得するために必要な ID に基づいて、実験プラットフォームはオフロード関連のロジックを完了するように要求され、オフロード ID がエンドポイントに返され、エンドポイントはそれに基づいて対応する戦略を作成します。受け取ったID。その利点は、シャントの均一性と安定性を保証できる実験プラットフォームを備えていることです。欠点は、実験的な分路を実行する前に機器を初期化する必要があることです。

もう 1 つのオフロード方法は、クライアント ローカル オフロードです。この方法は比較的ニッチであり、主に一部の UG シーン、広告画面のオープニング シーン、およびパフォーマンスの初期化シーンに適しています。このようにして、クライアントが初期化されるときに、すべてのオフロード ロジックが完了します。その利点は明らかであり、遅延がなく、電源を入れてすぐに配信を実行できます。論理的に言えば、その分布の均一性も保証できます。しかし、実際のビジネスシーンでは、その分布の均一性に問題が生じることがよくあります。その理由は次で紹介します

3. 新しいユーザー シナリオ AB 実験が直面する問題

UG シナリオが実際に直面する最初の問題は、トラフィックを早期に迂回することです。できるだけ。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

ここにトラフィック受け入れページなどの例を示します。プロダクト マネージャーは、UI を最適化してコア インジケーターを改善できると感じています。このようなシナリオでは、実験ができるだけ早く優先順位付けされることを願っています。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

ページ 1 のオフロード プロセス中に、デバイスが初期化され、ID が取得されます。 18.62% のユーザーが ID を生成できません。従来の実験的なプラットフォームの転用方法を使用すると、ユーザーの 18.62% がグループ化されず、固有の選択バイアスの問題が発生します

#さらに、新規ユーザーのトラフィックは非常に貴重です新規ユーザーの 18.62% が実験に利用できなくなり、実験期間とトラフィック利用効率に大きな損失が生じます。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

将来的には、実験のオフロードの問題をできるだけ早く解決するために、クライアントを使用して実験をローカルにオフロードする予定です。利点は、デバイスの初期化時にオフロードが完了することです。原理は、まず、端末で初期化するときに、端末自体が乱数を生成し、その乱数をハッシュして同じ方法でグループ化し、それによって実験グループと対照グループを生成できるということです。原則として、トラフィックの均等な分散を確保することは可能ですが、上図の一連のデータから、21% 以上のユーザーが繰り返し異なるグループに入っていることがわかります。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

Honor of Kings や Douyin などの非常に人気のある製品のユーザーが中毒になりやすいシナリオがあります。新規ユーザーは、実験サイクル中に何度もアンインストールと再インストールを行います。先ほど述べたローカル転用ロジックによれば、乱数の生成と転用によりユーザーが異なるグループに入ることができるため、転用 ID と統計 ID は 1 対 1 に一致できません。このことが偏在の問題を引き起こした。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

#新しいユーザー シナリオでは、実験的な評価基準の問題にも直面します。

この新規ユーザー トラフィックのシナリオのタイム チャートを再編成しました。アプリケーションの起動時に、オフロードを選択しました。均一な配布タイミングを達成し、同時にそれに対応する戦略的効果を生み出すことができると仮定します。次に、指標統計IDを生成するタイミングは戦略効果のタイミングよりも遅く、その時点で初めてデータを観測することができます。データ観測のタイミングが戦略効果のタイミングより大幅に遅れるため、生存者バイアスが発生します

2. 新しい実験システムとその科学的検証

上記課題を解決するために、新たな実験システムを提案し、科学的に検証しました

1. 新規ユーザーシナリオ実験流用ID選択

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

前述したように、新規ユーザーの流用選択の要件は比較的高いため、新規ユーザーの実験用の流用 ID はどのように選択すればよいでしょうか?以下にいくつかの原則を示します。

  • コンプライアンスは、海外事業でも国内事業でも、安全コンプライアンスは何よりも生命線であり、安全コンプライアンスは必ず守らなければなりません。そうしないと、棚から取り外されたときの影響が特に大きくなります。
  • #適時性。新しいユーザー シナリオの場合、適時である必要があり、起動直後にオフロードを取得できる必要があります。
  • ユニークな点は、単一の設置サイクル内でシャント ID が安定しており、インジケータ ID と 1 対 1 の対応を形成できることです。下図のデータからわかるように、流用IDと指標計算口径IDの1対1一致率は99.79%に達しており、指標計算IDと指標計算口径IDの1対1一致率は99.79%に達しています。転用IDも99.59%に達しました。基本的に、規格に従って選択された流用 ID と指標 ID が 1 対 1 で一致することが確認できます。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

2. 転用能力の科学的検証

転用 ID を選択すると、転用能力は次のようになります。多くの場合、2 つの方法があり、1 つ目は実験プラットフォームを使用する方法、2 つ目は最後まで使用する方法です。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

転用 ID を取得したら、その転用 ID を実験的プラットフォームに提供して、実験的プラットフォームでの転用機能を完成させます。配信プラットフォームとして最も基本的なことは、ランダム性を検証することです。 1つ目は均一性です。実験の同じレイヤーでは、トラフィックは多くのバケットに均等に分割され、各バケット内のグループの数は偶数である必要があります。ここで単純化すると、1 つの層に実験が 1 つだけあり、それを 2 つのグループ (a と b) に分けた場合、対照グループと実験グループのユーザー数はほぼ同じになるはずであり、これによって均一性が検証されます。転用能力。第二に、多層実験の場合、多層実験が相互に直交し、影響を受けないようにする必要があり、同様に、異なる層での実験間の直交性も検証する必要があります。均一性と直交性は、統計的カテゴリー検定を通じて検証できます。

転用選択の ID と転用機能を導入した後、最後に、新しく提案された転用結果が AB 実験の要件をインジケーター結果レベルから満たしているかどうかを検証する必要があります。

3. 転用結果の科学的検証

社内プラットフォームを使用して、複数の対空シミュレーションを実施しました

比較対照群と実験群が対応する指標に関する実験の要件を満たしているかどうか。次に、この一連のデータを見てみましょう。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

t 検定のいくつかのインデックス グループをサンプリングしました。非常に多くの実験において、タイプ 1 の誤り率は非常に低い確率であることが理解できます。タイプ 1 の誤り率は約 0.055% になる予定で、その信頼区間は実際には約 1000 回、つまり 0.0365 ~ 0.0635 の間にあるはずです。最初の列でサンプリングされたインジケーターの一部はこの実行範囲内にあることがわかります。そのため、タイプ 1 エラー率の観点からは、既存の実験システムは問題ありません。

同時に、テストが t 統計のテストであることを考慮すると、対応する t 統計は、大規模なトラフィックの分布の下では正規分布にほぼ従うはずです。 t 検定統計量の正規分布を検定することもできます。ここでは正規分布検定が使用されており、検定結果も 0.05 よりはるかに大きい、つまり帰無仮説が確立されている、つまり t 統計量がほぼ正規分布に従っていることがわかります。

各検定について、t 統計検定結果の p 値は、非常に多くの実験でほぼ均一に分布しています。同時に、p 値も均一に分布しています。同様の結果も見られます。分布テストの pvalue_uniform_test では、これも 0.05 よりもはるかに大きくなっています。したがって、pvalue はほぼ一様分布に従うという帰無仮説も OK です。

以上、流用IDと指標計算口径、流用能力と流用結果指標結果の一対一対応から、新しく提案する実験流用システムを検証しました。科学的な性質。

3. 適用事例分析

以下は、UG シナリオにおける実際の適用事例と組み合わせて、実験評価の実施方法を詳しく説明します。 3 番目の質問は、

1. 新しいユーザー シナリオの実験的評価

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

典型的な UG トラフィックです。受け入れシナリオ: トラフィック使用率を改善するために、NUJ の新しいユーザー ガイダンスまたは新しいユーザーのタスク中に多くの最適化が行われます。このときの評価基準は定着率であることが多く、これが現在の業界の共通認識となっています。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

新しいユーザーのダウンロードからインストール、最初の起動までのプロセスを想定すると、PM はそのようなプロセスがユーザー、特にこれまで一度も使用したことのないユーザーにとって有用であると感じています。製品のこの部分のユーザーにとって敷居が高すぎます。ログインに誘導される前に、ユーザーはまず製品に慣れ、製品のヒップホップの瞬間を体験する必要がありますか?

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

さらに、プロダクト マネージャーは別の仮説を立てました。つまり、これまで製品を体験したことのないユーザーに対して、新しいユーザーがログインしたり、新しいユーザー NUJ シーン内の抵抗を軽減します。すでに製品を体験しているユーザーやデバイスを切り替えたユーザーについては、引き続きオンラインプロセスが使用されます。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

#指標に基づいた転用方法ID はまずインジケーター ID を取得し、次にトリアージします。この分割方法は通常均一であり、実験結果や保持率と大きな差異はありません。このような結果から判断すると、総合的な判断を下すことは困難です。この種の実験は実際にはトラフィックの一部を無駄にし、選択バイアスの問題を抱えています。次の図は、ローカル シャント実験の結果を示しています。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

グループに新規参入したデバイスの数その違いは信じられるほどです。同時に定着率の改善も見られますが、他のコア指標では実はマイナスになっており、このマイナスの方向性は実は定着率と大きく関係しているため理解しにくいのです。したがって、そのようなデータに基づいてそれを説明したり帰属させたりすることは困難であり、総合的な判断を下すことも困難です。

グループに繰り返し追加されたユーザーの状況を観察すると、20% 以上のユーザーが繰り返し異なるグループに割り当てられていることがわかります。これにより、AB 実験のランダム性が破壊され、科学的な比較決定を行うことが困難になります。

最後に、提案された新しいシャントの実験結果を見てみましょう。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

オンにするとトラフィックを迂回できます。迂回容量は内部プラットフォームによって保証されており、トラフィックの均一性と安定性を確保できます。かなりの範囲で流用されています。実験データから判断すると、ほぼそれに近い値であり、平方根検定を行うと、十分にニーズを満たしていることがわかります。同時に、有効な新規デバイスの数が 1% と大幅に増加し、維持率も向上していることがわかります。同時に、対照グループまたは実験グループのみに注目すると、最終的に生成された新しいデバイスへの迂回 ID に基づくトラフィック変換率がわかり、実験グループは対照グループより 1% 高くなります。この結果の理由は、実験グループが実際に NUJ と NUT へのユーザーの入り口を拡大し、より多くのユーザーが入り、製品を体験し、その後滞在しやすくなったためです。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

実験データをログイン部分と非ログイン部分に分割します。実験グループのユーザーでは、非ログイン部分を選択するユーザーが多いことがわかります。ログイン。製品を体験するためのログイン モードが追加され、継続率も向上しました。これも期待どおりの結果です。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

ご覧のとおり、日ごとの指標とグループに入った人の実際のユーザー数は以前から書かれていますが、日ごとに見ると着実に増加しており、リテンション指数も向上しています。対照グループと比較して、実験グループは有効なデバイスの数と定着率が向上しました。

ユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?

新規ユーザー トラフィックの受け入れシナリオでは、評価指標は維持率または短期 LT の観点からさらに評価されます。ここで、最適化は実際には LT レベルの 1 次元空間でのみ実行されます

しかし、新しい実験システムでは、1 次元の最適化が 2 次元の最適化に変換されます。次元の最適化 DNU God Shang LT は全体的に改良され、戦略空間が 1 次元から 2 次元に変更され、同時に、一部のシナリオでは LT の一部の損失が許容されるようになりました。

4. まとめ

最後に、新しいユーザー シナリオにおける実験機能の構築と実験の評価基準についてまとめてみましょう。

  • UG 新しいユーザー シナリオにおける既存の実験システムでは、新しいユーザー トラフィック受け入れ戦略の評価で直面する問題を完全には解決できません。新しい実験システムは、必要です。
  • オフロード ID の選択にはいくつかの基準があります。1 つ目はセキュリティ準拠、2 つ目は最初の起動時に取得可能、3 つ目は一定期間内に取得できることです。単一のインストール サイクルは安定しており、インジケーター ID との注入関係があります。
  • 新しいユーザー シナリオの実験的評価は、多次元の最適化です。収益は、以前の評価とは異なり、新しいデバイスの有効数とデバイスの維持から得られます。デバイスの保持。
  • #「新規」ユーザーを受け入れることは、多くの場合、ビジネスに大きなメリットをもたらします。ここでの「新規」とは、新規ユーザーだけでなく、アンインストールして再インストールしたユーザーも指します。

以上がユーザー成長シナリオで AB 実験システムを構築するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 Mar 26, 2024 pm 12:41 PM

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

Jiuzhang Yunji DataCanvas マルチモーダル大規模モデル プラットフォームの実践と考察 Jiuzhang Yunji DataCanvas マルチモーダル大規模モデル プラットフォームの実践と考察 Oct 20, 2023 am 08:45 AM

1. マルチモーダル大型モデルの発展の歴史 上の写真は、1956 年に米国のダートマス大学で開催された最初の人工知能ワークショップです。このカンファレンスが人工知能開発の始まりとも考えられています。記号論理学の先駆者たち(前列中央の神経生物学者ピーター・ミルナーを除く)。しかし、この記号論理理論は長い間実現できず、1980 年代と 1990 年代に最初の AI の冬の到来さえもたらしました。最近の大規模な言語モデルが実装されて初めて、ニューラル ネットワークが実際にこの論理的思考を担っていることがわかりました。神経生物学者ピーター ミルナーの研究は、その後の人工ニューラル ネットワークの開発に影響を与えました。彼が参加に招待されたのはこのためです。このプロジェクトでは。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる 人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる Mar 22, 2024 pm 10:10 PM

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

PHP アルゴリズム分析: 配列内の欠落している数値を見つける効率的な方法 PHP アルゴリズム分析: 配列内の欠落している数値を見つける効率的な方法 Mar 02, 2024 am 08:39 AM

PHP アルゴリズム分析: 配列内の欠落している数値を見つけるための効率的な方法 PHP アプリケーションの開発過程では、配列内の欠落している数値を見つける必要がある状況によく遭遇します。この状況はデータ処理やアルゴリズム設計において非常に一般的なため、この問題を解決するには効率的な検索アルゴリズムを習得する必要があります。この記事では、配列内で欠落している数値を見つける効率的な方法を紹介し、具体的な PHP コード例を添付します。問題の説明 1 から 100 までの整数を含む配列があるが、数値が 1 つ欠落しているとします。を設計する必要があります。

See all articles