如何進行有效的數據分析
推薦教學:Python教學
在網路的下半場,不斷在精細化營運的背景下,產品經理不再是單純的靠感覺來做產品,更需要培養數據的意識,能以數據為依歸,來不斷改善產品。
不同於公司專業的數據分析師,產品經理更多的可以從用戶、業務的層面去看待數據,去更快更透徹的去尋找數據變動的原因。
那麼在資料已經被有效記錄的前提下,如何有效的去分析資料呢?
一、明確資料分析的目的
# 1、如果資料分析的目的是要比較頁面改版前後的優劣,則衡量的指標應該從頁面的點擊率,跳出率等維度出發,電商類應用還要觀察訂單轉換率,社交類應用要注重用戶的訪問時長、點讚轉發互動等頻次。
不少新人在設計自己產品的時候,可能會花費很多時間在產品本身的設計上,卻沒有花精力思考如何衡量產品的成功與否,在產品文檔上寫上一句類似「使用者體驗有所」提升的空話,這樣既不利於產品設計順利通過需求評審,也無法更有效的快速提高產品的KPI指標。
2、如果資料分析的目的是探究某一模組資料異常波動的原因,則分析的方法應該按照金字塔原理逐步拆解,版本->時間->人群。
例如發現首頁猜你喜歡模組最近的點擊率從40%下降到了35%,暴跌5%個點,這個時候先看看是不是哪個版本的資料發生了波動,是不是因為新版上線埋點遺漏或有誤造成的。
如果版本的波動數據保持一致,再看看數據是從什麼時候開始變化的,是不是因為受到了聖誕、元旦假日因素的影響,頁面上其他模組上線了新的活動影響了猜你喜歡的轉換。
如果不是,則再拆解是不是流量來源構成發生了變動,是不是新用戶的曝光數量增加導致的。
產品經理需要帶著明確的目的去分析數據,思考實現目標需要建構哪些維度去驗證。大部分時候,產品經理需要非常耐心的一步一步的拆解細分,排查原因。
二、多通路收集資料
# 收集方式一般有四類管道。
1、從外部如易觀或艾瑞的行業數據分析報告獲取,需要帶著審慎的態度去觀察數據,提取有效準確的信息,剝離部分可能注水的數據,並需要時刻警惕那些被人處理過的二手數據。
2、從AppStore、客服意見回饋、微博等社群論壇去主動收集使用者的回饋。我自己常有空的時候就會去社群論壇看看用戶的狀態評論,一般這樣的評論都是非常極端的,要么特別好,要么罵成狗,但這些評論對於自身產品設計的提升還是非常有益的,可以嘗試去反推用戶當時當刻為什麼會產生如此的情緒。
3、自行參與問卷設計、用戶訪談等研究,面對用戶,收集一手數據,觀察用戶使用產品時所遇到的問題及感受。問卷需要提煉核心問題,減少問題,回收結果需剔除無效的敷衍的問卷。使用者訪談需要注意不使用引導性的詞彙或問題去帶偏使用者的自然感受。
4、從已記錄的使用者行為軌跡去研究資料。大公司一般會有固話的報表/郵件去每天甚至即時回饋線上的使用者資料狀況,也會提供SQL查詢平台給產品經理或資料分析師,讓他們可以更有深度的探究比較資料。
三、有效剔除幹擾資料
#1、選取正確的樣本數量,選取足夠大的數量,剔除極端或偶然性資料的影響。 08年奧運會上,姚明的三分投籃命中率為100%,Kobe的三分投籃命中率為32%,那麼是說姚明的三分投籃命中率要比Kobe高?顯示有問題,因為那屆奧運會,姚明只投了一個三分球,Kobe投了53個。
2、制定相同的抽樣規則,減少分析結論的偏差性。例如兩條Push文案,第1條“您有一個外賣暖心紅包未領取,最大的紅包只留給最會吃的你,點擊進入”,第2條“送你一個外賣低溫福利,足不出戶吃喝熱騰美味,點擊領取」。實驗數據表明,第二條Push文案的點擊率比第一條同比高了30%。那真的是第二條文案比較有吸引力嘛?結果發現是第二條Push文案的接收人群的活躍度明顯高於第一條造成的。
3、剔除版本或假日因素的干擾,新版本剛上線時的資料表現往往會很好,因為主動升級的使用者通常是高活躍度的用戶。臨近週末或大型假日的時候,用戶的消費需求會被觸發,電商類應用的訂單轉換率也會直線上升。因此,在數據比較的時候,實驗組和對照組的數據在時間維度上要保持對應。
4、對歷史資料遺忘。人與數據技術不同,數據技術有著100%的記憶能力,而人類根據艾浩賓斯遺忘定律1天後只能記起33%,6天後25%,31天後21%。因此,我們要合理的選擇篩選時段。例如猜你喜歡模組不僅要對興趣標籤的計分進行一定的加權處理,還要結合商品的生命週期等因素做一系列的回歸實驗,得出受眾人群對各類興趣和購買傾向的衰退曲線,利用規律的時間變化有效刪除老數據,去提升模組的點擊率。
5、實驗需分割A1組,也就是在實驗組B和對照組A上再增加一組A1,A1和A的規則保持一致,然後探究AB的數據波動與AA1比較,剔除數據的自然/異常波動帶來的影響。以我實際的A/B實驗表明,設立A1組是非常重要且必要的,不管數據量級有多大,相同實驗規則的兩組在數據也會有一定的小幅波動,而這小幅波動在精細化在營運的今天,對我們的判斷可能形成較大的干擾偏差。
四、合理客觀的檢視數據
# 1、不要忽略沉默使用者
# 產品經理在聽到部分用戶回饋的時候就做出決策,花費大量的時間開發相應的功能,往往結果,可能這些功能只是極少數用戶的迫切需求,而大部分用戶並不在乎。甚至有可能與核心用戶的訴求相違背,導致新版產品上線後數據猛跌。
忽略沉默用戶,沒有全盤的考慮產品大部分目標用戶的核心需求,可能造成人力物力的浪費,更有甚者,會錯失商業機會。
2、全面理解資料結果
如果實驗結果的預期與我們的經驗認知有明顯的偏差,請不要盲目下結論質疑自己的直覺,而是試著對數據進行更透徹的分析。
### 例如我曾經做過在首頁給用戶投放活動彈跳窗的實驗,發現實驗組的數據不管在首頁的點擊率,訂單轉換率甚至7日留存率方面都遠超對照組,首頁上的每個模組的轉換率都有明顯的提升,遠遠超出了我們的預期,那這真的是活動彈跳窗刺激了使用者的轉換率嘛? ############ 後來我們發現在首頁能夠展示出活動彈窗的用戶,往往在使用環境時的網路狀態比較好,在wifi環境下,而未展示彈跳窗的用戶則可能是在公車/地鐵/商場等移動場景下,網路通訊可能不佳,因此影響了A/B實驗的結果。 ############### 3、不要過度依賴數據############### 過度依賴數據,一方面,會讓我們做很多沒有價值的數據分析;另一方面,也會限制產品經理本來應有的靈感與創意。 ######正像羅振宇在時間的朋友跨年演講上提到的一樣。用戶要什麼,你就給什麼,甚至他們沒說出來你就猜到了,這叫母愛演算法,在內容分發領域沒有人比今日頭條做得更好,但母愛演算法有很大的弊端,在推薦的時候會越推越窄。
另一面則是父愛演算法,站的高,看得遠。告訴用戶,放下你手上的爛東西,我告訴你一個好東西,跟我來。正像喬幫主當年打造的iPhone系列產品一樣,不看市場分析,不做用戶研究,打造出超出使用者預期的產品。
五、總結
# 美國最成功的影片網站Netflix透過基於使用者習慣的分析,將大數據分析深入電影的創作環節中,塑造了風靡一時的美劇《紙牌屋》。然而Netflix的工作人員告訴我們,不應該迷戀大數據
如果說電視劇評分9分是精品的話,大數據可以讓我們脫離低分6分以下的風險,卻也會帶我們按部就班的走向平庸的絕大多數7-8分之間。
以上是如何進行有效的數據分析的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

大數據結構處理技巧:分塊:分解資料集並分塊處理,減少記憶體消耗。生成器:逐一產生資料項,無需載入整個資料集,適用於無限資料集。流:逐行讀取檔案或查詢結果,適用於大檔案或遠端資料。外部儲存:對於超大資料集,將資料儲存在資料庫或NoSQL中。

在網路時代,大數據成為了一種新的資源,伴隨著大數據分析技術的不斷提升,大數據程式設計需求也愈發迫切。而C++作為一種廣泛應用的程式語言,其在大數據程式設計上的獨特優勢也日益凸顯。以下將分享我在C++大數據程式設計的實作經驗。一、選擇合適的資料結構選擇合適的資料結構是編寫高效大數據程式的重要環節。 C++中有多種資料結構可以供我們使用,如陣列、鍊錶、樹、雜湊表等

AEC/O(Architecture,Engineering&Construction/Operation)指在建築業中提供建築設計、工程設計、施工及營運的綜合服務。 2024年,AEC/O產業在技術進步中面臨不斷變化的挑戰。今年預計將整合先進技術,預示著設計、建造和營運的典範轉移。為了因應這些變化,業界正在重新定義工作流程,調整優先級,增強合作,以適應快速變化世界的需求。 AEC/O產業以下五大趨勢將成為2024年的關鍵主題,推薦其邁向更整合、反應迅速且永續的未來:一體化供應鏈、智慧工

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

在當今大數據時代,數據處理和分析已成為各行業發展的重要支持。而Go語言作為一種開發效率高、效能優越的程式語言,也逐漸被大數據領域所關注。然而,相較於其他語言如Java、Python等,Go語言在大數據框架上的支援相對不足,這給一些開發者帶來了困擾。本文將探討Go語言大數據框架缺失的主要原因,並提出對應的解決方案,同時結合具體的程式碼範例進行說明。一、Go語

易知微2023年秋季產品發表會已經圓滿結束了!讓我們一起回顧一下發表會的精彩亮點吧!一、智能普惠開放,讓數位孿生成為生產力袋鼠雲端聯合創辦人、易知微CEO寧海元開場致詞提出:在今年公司的戰略會上,我們把產品研發的主要方向定位成「智能普惠開放「三大核心能力,圍繞著「智慧普惠開放」這三大核心關鍵字,我們進一步提出「讓數位孿生成為生產力」的發展目標。二、EasyTwin:探索更易用的數位孿生新引擎1、從0.1到1.0,持續探索數位孿生融合渲染引擎有更優解以成熟的3D編輯模式、便捷的交互藍圖、海量的模型資產

Go語言作為一種開源程式語言,在近年來逐漸受到了廣泛的關注和使用。它以其簡潔、高效的特性,以及強大的並發處理能力而備受程式設計師青睞。在大數據處理領域中,Go語言也具有很強的潛力,可以用來處理大量資料、最佳化效能,並且可以很好地與各種大數據處理工具和框架進行整合。在本文中,我們將介紹一些Go語言大數據處理的基本概念和技巧,並透過具體的程式碼範例來展示如何利用Go語言

在大数据处理中,采用内存数据库(如Aerospike)可以提升C++应用程序的性能,因为它将数据存储在计算机内存中,消除了磁盘I/O瓶颈,显著提高了数据访问速度。实战案例表明,使用内存数据库的查询速度比使用硬盘数据库快几个数量级。