目錄
一、新使用者場景下實驗面臨的問題
#1、UG全景圖
2、AB實驗原理
3、新使用者場景AB實驗面臨的問題
#二、新實驗體系及其科學性驗證
三、應用案例分析
1、新使用者場景實驗評估
四、總結
首頁 科技週邊 人工智慧 如何建構使用者成長場景下的AB實驗體系?

如何建構使用者成長場景下的AB實驗體系?

Sep 29, 2023 pm 10:57 PM
演算法 ab 實驗體系

如何建構使用者成長場景下的AB實驗體系?

一、新使用者場景下實驗面臨的問題

#1、UG全景圖

#這是UG 的全景圖。

如何建構使用者成長場景下的AB實驗體系?

UG 透過管道,如 Paid Ads、 ASO、SEO 等管道,獲客引流到 APP。接下來,會做一些新手的運作和引導,來促進用戶,使其進入成熟期。後續使用者可能會慢慢失活,進入衰退期,甚至進入流失期。在這段期間會做一些流失的預警,促活的召回,後面還有一些對流失用戶的召回。

可以歸納為上圖的公式, 即 DAU 等於 DNU 乘以 LT。 UG 場景下的所有工作都可以基於這個公式來拆解。

2、AB實驗原理

如何建構使用者成長場景下的AB實驗體系?

#AB實驗的目的是將流量完全隨機的分配,針對實驗組和不同的對照組採取不同的策略。最終結合統計方法和實驗假設做出科學決策,這構成了整個實驗的框架。目前市面上的實驗分流類型大致分為兩種:實驗平台分流與客戶端本地分流

如何建構使用者成長場景下的AB實驗體系?

實驗平台分流是有前提的,需要設備完成初始化以後能取得到穩定的ID,基於這個ID 向實驗平台請求實驗平台完成分流相關的邏輯,把分流ID 回傳給給端上,然後端上基於收到的ID 做對應的策略。它的優點是有一個實驗平台,能夠確保分流的均勻性和穩定性。它的缺點是設備必須完成初始化以後才能進行實驗分流。 

另一種分流方式是客戶端本地分流。這種方式相對來說比較小眾,主要適用於一些UG場景、廣告開屏場景以及效能初始化場景。在這種方式下,所有的分流邏輯都在客戶端初始化時完成。它的優點很明顯,即無時延,開機即可進行分流。從邏輯上來說,它的分流均勻性也能夠得到保證。然而,在實際的業務場景中,它的分流均勻性常常存在問題。接下來將介紹其原因

3、新使用者場景AB實驗面臨的問題

UG 場景實際面臨的第一個問題是盡可能早的分流。 

如何建構使用者成長場景下的AB實驗體系?

這裡舉個例子,例如這裡的流量承接頁面,產品經理覺得 UI 可以再優化一下,進而提升核心指標。在這樣的場景下,我們希望實驗能儘早進行分流。 

如何建構使用者成長場景下的AB實驗體系?

在頁面1的分流過程中,裝置會進行初始化並取得ID。有18.62%的用戶無法產生ID。如果使用傳統的實驗平台分流方式,將會有18.62%的用戶無法被分組,從而導致固有的選擇偏差問題

另外,新用戶的流量是非常寶貴的,有18. 62% 的新用戶不能被用於實驗,對於實驗的時長和流量利用效率也是有很大的損失。

如何建構使用者成長場景下的AB實驗體系?

未來解決實驗盡可能早的分流的問題,我們就會用客戶端本地分流實驗。其優點是在設備初始化的時候,就完成了分流。其原理為,首先是在端上面初始化的時候,它本身就可以產生隨機數,對隨機數進行哈希以後進行同樣的分組,進而產生了實驗組和對照組。從原理上看,應該能夠保證分流是均勻的,但透過上圖中的一組數據會發現,有超過 21% 的用戶是重複進到不同的組的。

如何建構使用者成長場景下的AB實驗體系?

有一個場景是,一些很受歡迎的產品,像是王者榮耀或抖音,使用者很容易上癮。新用戶在實驗週期裡面會有多次的卸載重裝。按照剛剛講的本地分流的邏輯,隨機數的產生和分流以後會讓使用者進入不同的群組,這樣就會出現分流的 ID 和統計 ID 不能一對一匹配。造成了分流不均勻的問題。 

如何建構使用者成長場景下的AB實驗體系?

在新使用者情境下,我們也面臨實驗評估標準的問題。

我們重新整理了新用戶流量承接這一幕的時間圖。在應用程式啟動時,我們選擇了進行分流。假設我們能夠在分流的時機做到均勻,並且同時產生對應的策略效果。接下來,產生指標統計ID的時機比策略效果的時機要晚,只有在這時才能觀測到資料。資料觀​​測的時機遠遠落後於策略效果的時機,這將導致倖存者偏差

#二、新實驗體系及其科學性驗證

如何建構使用者成長場景下的AB實驗體系?

  • #為了解決上述問題,我們提出了一個新的實驗體系,並對其進行了科學性驗證
  • #1、新使用者場景實驗分流ID選擇  
  • 在前面已經提到,對於新用戶的分流選擇要求會比較高,那麼如何選擇新用戶實驗的分流ID 呢?以下是幾個原則:

如何建構使用者成長場景下的AB實驗體系?合規性,不管是海外業務還是國內業務,安全合規首先是生命線,一定要滿足安全合規,否則一旦被下架影響會特別大。

及時性,對於新使用者場景,一定是要及時,開機即可取得分流。

如何建構使用者成長場景下的AB實驗體系?

唯一性,在單次安裝週期內,分流的 ID 是穩定的,同時接指標口徑 ID 能形成一一對應的關係。透過下圖中的資料可以看到,分流 ID 和指標計算口徑 ID 一對一的匹配比例達到了 99.79%,指標計算 ID 和分流 ID 的一對一比例也達到了 99. 59%。基本上可以驗證,依照標準選擇的分流 ID 和指標 ID 是能夠做到一對應的。

2、分流能力科學性驗證

選擇好分流ID 以後,分流能力往往是透過兩種方式,第一種是透過實驗平台,第二種是透過端上完成。 

######有了分流的 ID 以後,把分流 ID 提供給實驗平台,在實驗平台完成分流的能力。作為分流平台,最基本的是需要驗證它的隨機性。首先就是均勻性。在同一層實驗裡面,把流量均勻地分到了很多分桶,每個分桶進組的數量應該是均勻的。這裡可以簡化一下,假如一層只有一個實驗,分成 a、 b 兩組,進組的對照組和實驗組的使用者數應該是近似相等的,進而驗證分流能力的均勻性。其次,對於多層實驗,多層實驗之間應該是互相正交,不受影響的,同理這裡也需要去驗證不同層實驗之間的正交性。可以用統計上的 category test 去驗證均勻性和正交性。  ############介紹完分流選擇的 ID 與分流的能力,最後要從指標結果層次去驗證新提出的分流結果,是否符合 AB 實驗的要求。 #########3、分流結果科學性驗證#########透過利用內部平台,我們進行了多次AA模擬############比較對照組和實驗組在對應的指標上是否滿足實驗的要求。接下來來看這一組數據。 #######

如何建構使用者成長場景下的AB實驗體系?

抽樣了一些t 檢定的指標組,可以理解為對於做的這麼多次試驗,放type one error rate 應該是在很小的機率,假設type one error rate 預定是在0. 055% 左右,它的置信區間其實應該在1000 次左右,應該是在0. 0365- 0. 0635 之間。可以看到第一列抽樣出來的一些指標,都在這個執行區間之內,所以從 type one error rate 視角來看現有的這個實驗體係是 OK 的。

同時考慮到檢定是對於 t 統計量的檢驗,對應的 t 統計量在大流量的分佈下面,應該是近似地服從常態分佈的。也可以對 t 檢定的統計量做常態分佈的檢定。這裡用了常態分佈的檢驗,可以看到檢驗出來的結果也是遠大於 0.05 的,即原假設成立,也就是 t 統計量是近似服從常態分佈的。

對於每次檢定t 統計量檢定出來的結果的pvalue,在這麼多次實驗裡面來看,也是近似地服從均勻分佈的,同時也可以對pvalue 做均勻分佈的檢驗,pvalue_uniform_test,也可以看到類似的結果,它也是遠大於0.05 的。所以原假設 pvalue 近似服從均勻分佈也是 OK 的。

以上從分流ID 和指標計算口徑的一一對應關係,從分流的能力和分流的結果指標結果上面都去驗證了新提出來的這種實驗分流體系的科學性。

三、應用案例分析

以下將結合UG場景下的實際應用案例,詳細講解如何進行實驗評估,以解決前面提到的第三個問題

1、新使用者場景實驗評估

如何建構使用者成長場景下的AB實驗體系?

這裡有典型的UG 流量承接場景,在NUJ 新用戶引導或新用戶任務的時候會做很多的優化,從而提升流量利用率。這時候的評估標準往往都會是 retention rate,這是業界現有的常規理解。

如何建構使用者成長場景下的AB實驗體系?

假設從新使用者下載到安裝到首啟動的這個流程, PM 覺得這樣的流程對於使用者使用,特別是從未體驗過產品使用的這一部分用戶來說門檻太高了,是不是應該先讓用戶熟悉產品,體驗到產品的嘻哈moment 以後,再引導登入。

如何建構使用者成長場景下的AB實驗體系?

進一步,產品經理提出了另一個假設,即對於從未體驗過產品的用戶,在新用戶登入或新用戶NUJ場景中降低阻力。對於已經體驗過產品的用戶和換機用戶,則仍然採用線上流程

如何建構使用者成長場景下的AB實驗體系?

基於指標ID 進行分流的方法首先獲取指標的ID,然後進行分流。這種分流方法通常是均勻的,從實驗結果和保留率來看,沒有太大的差異。從這樣的結果來看,很難做出全面的決策。這種實驗實際上浪費了一部分流量,並且有選擇偏差的問題。因此,我們會進行本地分流實驗,下圖展示了本地分流實驗的結果

如何建構使用者成長場景下的AB實驗體系?

進組的新設備數上面會有顯著性的差異,而且是信賴的。同時在 retention rate 上面有提升,但在其它核心指標上其實是有負向的,而且這個負向很難被理解,因為它跟留存其實是強相關的。所以基於這樣的數據,也很難解釋或歸因,也很難做出推全的決策。

可以觀察重複進組的使用者狀況,會發現超過20%的使用者被重複分到不同的群組。這破壞了AB實驗的分流隨機性,導致很難做出科學比較的決策

#

最後,看一下用提出的新的分流的實驗的結果。

如何建構使用者成長場景下的AB實驗體系?

開機即可分流,分流能力是由內部平台來保證的,它能夠極大程度地保證分流的均勻性和穩定性。從實驗的數據來看,幾乎是接近的,在做開方檢驗的時候也能夠看到它是完全滿足需求的。同時看到有效的新設備數是有極大的增加的,增加了1%,同時在 retention rate 上面也有所提升。同時從對照組或單看實驗組,能夠看到基於分流 ID 到最終產生的新設備的流量轉換率,實驗組比對照組提升了 1% 。之所以會出現這樣的結果,實驗組其實是放大了用戶在 NUJ 和 NUT 的這個入水口,有更多的用戶更容易進來體驗到產品,進而留下來。

如何建構使用者成長場景下的AB實驗體系?

將實驗數據分成登入和非登入兩部分,可以發現對於實驗組的使用者來說,更多的使用者選擇了非登入模式來體驗產品,並且留存率也有所提升,這個結果也符合預期

如何建構使用者成長場景下的AB實驗體系?

#可以看到by daily 的指標,進組的用戶數,其實是有長期寫,by daily 來看是穩定增加的,同時留存指標也有提升。實驗組相比對照組在有效設備數和留存上都是有提升的。

如何建構使用者成長場景下的AB實驗體系?

對於新用戶流量承接的場景,評估指標更常從留存或短期的LT維度進行評估。在這裡,優化實際上只是在LT層級的一維空間上進行的

而在新的實驗體系裡面,把一維優化變成了二維優化, DNU 神尚LT 整體得到了提升,這樣策略空間從以前的一維變成了二維,同時在有些場景下是能接受一部分LT 的損失的。 

四、總結

最後,對新使用者情境下實驗能力建構和實驗評估標準進行一下總結。

  • UG 新使用者情境下現有的實驗系統無法完全解決新使用者流量承接策略評估所面臨的問題,需要新的實驗系統。
  • 分流 ID 的選擇有幾個標準,首先是安全合規,然後是首次啟動即可獲取,再者是在單次安裝週期內是穩定的,並且跟指標ID 是單射的關係。
  • 針對新用戶場景的實驗評估是一個多維優化,收益來自有效的新設備數和設備的留存,而不像以前只評估設備的留存。
  • 針對「新」用戶的承接,往往會有巨大的業務效益。這裡的“新”,不光指新的用戶,還包括卸載重裝的用戶。

以上是如何建構使用者成長場景下的AB實驗體系?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

CLIP-BEVFormer:明確監督BEVFormer結構,提升長尾偵測性能 CLIP-BEVFormer:明確監督BEVFormer結構,提升長尾偵測性能 Mar 26, 2024 pm 12:41 PM

寫在前面&筆者的個人理解目前,在整個自動駕駛系統當中,感知模組扮演了其中至關重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後,才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息,用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結果能便捷地應用於各種下游任務,因此受到工業

使用C++實現機器學習演算法:常見挑戰及解決方案 使用C++實現機器學習演算法:常見挑戰及解決方案 Jun 03, 2024 pm 01:25 PM

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

探究C++sort函數的底層原理與演算法選擇 探究C++sort函數的底層原理與演算法選擇 Apr 02, 2024 pm 05:36 PM

C++sort函數底層採用歸併排序,其複雜度為O(nlogn),並提供不同的排序演算法選擇,包括快速排序、堆排序和穩定排序。

人工智慧可以預測犯罪嗎?探索CrimeGPT的能力 人工智慧可以預測犯罪嗎?探索CrimeGPT的能力 Mar 22, 2024 pm 10:10 PM

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統,用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測:基礎知識CrimeGPT利用機器學習演算法來分析大量資料集,識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢,人工智慧可以為執法機構

改進的檢測演算法:用於高解析度光學遙感影像目標檢測 改進的檢測演算法:用於高解析度光學遙感影像目標檢測 Jun 06, 2024 pm 12:33 PM

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

九章雲極DataCanvas多模態大模型平台的實踐與思考 九章雲極DataCanvas多模態大模型平台的實踐與思考 Oct 20, 2023 am 08:45 AM

一、多模態大模型的歷史發展上圖這張照片是1956年在美國達特茅斯學院舉行的第一屆人工智慧workshop,這次會議也被認為拉開了人工智慧的序幕,與會者主要是符號邏輯學屆的前驅(除了前排中間的神經生物學家PeterMilner)。然而這套符號邏輯學理論在隨後的很長一段時間內都無法實現,甚至到80年代90年代還迎來了第一次AI寒冬期。直到最近大語言模型的落地,我們才發現真正承載這個邏輯思維的是神經網絡,神經生物學家PeterMilner的工作激發了後來人工神經網絡的發展,也正因為此他被邀請參加了這個

演算法在 58 畫像平台建置中的應用 演算法在 58 畫像平台建置中的應用 May 09, 2024 am 09:01 AM

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

即時加SOTA一飛沖天! FastOcc:推理更快、部署友善Occ演算法來啦! 即時加SOTA一飛沖天! FastOcc:推理更快、部署友善Occ演算法來啦! Mar 14, 2024 pm 11:50 PM

寫在前面&筆者的個人理解在自動駕駛系統當中,感知任務是整個自駕系統中至關重要的組成部分。感知任務的主要目標是使自動駕駛車輛能夠理解和感知周圍的環境元素,如行駛在路上的車輛、路旁的行人、行駛過程中遇到的障礙物、路上的交通標誌等,從而幫助下游模組做出正確合理的決策和行為。在一輛具備自動駕駛功能的車輛中,通常會配備不同類型的信息採集感測器,如環視相機感測器、雷射雷達感測器以及毫米波雷達感測器等等,從而確保自動駕駛車輛能夠準確感知和理解周圍環境要素,使自動駕駛車輛在自主行駛的過程中能夠做出正確的決斷。目

See all articles