在分析資料過程中,你是不是經常遇到很多異常資料的問題,比如:
● 某家商店近一週的成交量環比突然下降了10%
● 某個APP的日活使用者數相比昨天下降了15%
● ……
在遇到這些資料異常問題時我們要怎麼進行分析呢?怎樣才能準確快速地定位到異常原因呢?今天數據君就來跟大家分享一下異常資料排查的思路。
01 資料準確性
我們在面對異常資料的第一步就是要確認資料的準確性,也是就是這個異常是否是真的異常,而不僅僅只是資料統計出現了問題。
很多新手在進行分析時往往會忽略這一步,直接預設資料庫中的資料就是準確的,這樣其實是不對的,在沒有確認資料的準確性就框框一頓分析,很有可能就會白做工。
那麼要如何確認資料的準確性呢?這個可以分為三步驟。
1、確認資料埋點正確
資料埋點是我們取數的基礎,確保埋點資料的正確性是資料分析首要做的事情。
例如某APP日活相比昨天下降15%,作為資料分析師的我們首先應該確認資料庫中的埋點資料是否有異常。
比如,資料是否同步更新到最新,資料庫資料欄位型別是否正確,資料是否出現bug顯示為空等等。
2、確認資料口徑
出現異常資料的另一個可能性是,你進行計算使用的資料表或者欄位並不是目標計算需求應該使用的資料。簡單來說,就是使用了錯誤的資料表或欄位。
因此在進行分析之前,瞭解資料埋點的含義並仔細確認所使用的資料欄位是符合需求也是非常重要的。
3、確認計算是否正確
除了資料埋點和資料口徑,錯誤的計算邏輯或者計算方式也可能是出現異常資料的原因。因此,我們需要釐清計算的邏輯,確保邏輯和方式沒有問題。
02 同期事件評估
在我們確認資料來源層面沒有問題,即我們發現的資料異常真的就是異常後,我們就需要對這個異常發生的時間節點下的相關事件進行分析,看是否是它們造成了異常。
下面是我們可以考慮的一些同期事件的角度:
03 維度拆分分析
如果你發現同期事件並不是導致資料異常的原因,那麼就可以對資料展示的維度進行拆分來進一步分析。
例如:某網站當天的訂單量相比昨天明顯下跌,我們就可以從產品、流量、使用者的角度進行拆解分析。
產品角度:
在確認資料是準確的,和事業部人員確認進行並沒有額外的營運活動,並沒有負面報道被擴散、並沒有競爭對手在做活動後,我們可以先從產品的角度進行分析。
透過折線圖發現,在8月12日到8月17日期間,尤其在16號到17號,該電商售賣的五個產品中,只有5號產品在商品下單存在上升的情況,其他4個產品均出現了大幅度下滑狀況。
幾乎所有產品種類都出現了訂單下滑的情況,只有一個個別情況,那麼基本可以判斷不是產品本身的問題,可能產品之外的因素出現了問題。
因此,我們分析一下其他因素,看一下是否是某類商品缺貨、或者價格上出現了問題。
首先分析是否是因為商品的缺貨影響了訂單量的下降,我們建立相關圖表,如下所示:
從圖中可以看出,五個產品的貨存量都很充足,基本都在100以上、200以下,貨存量均遠超進貨量且未出現明顯的波動。
一般來說,進貨量的波動是因為貨物產生了進入和流出的比例: 流入大於流出說明供大於求,出現商品積壓的現象;流出大於流入說明供不應求,出現商品短缺的現象;
那麼是否是由於價格的變動導致訂單下降呢?一般來說,價格是最能影響銷量的因素之一,因此我們建立了不同產品的進貨單價示意圖:
由上圖可知,產品進貨單價並沒有出現異常大幅度的波動,基本可以判定訂單下降情況與產品價格無關。
流量角度:
既然產品內部沒有出現異常,那我們猜測是網站流量出現了問題,比如可能是網站的主要廣告推廣渠道沒有及時續費、廣告被平臺下架導致使用者查詢不到該商品等等。
但是從上圖網站流量來看,訪問量和跳出次數雖然有上下波動的跡象,但是波動範圍都處於正常水平,這一步基本可以排除網站流量的原因。
使用者角度:
最後我們再來看一下使用者流程當中的各種指標,我們可以以一個漏斗模型描述使用者下單的過程:
使用者開啟某APP — — 搜尋關鍵詞查詢想要的商品 — — 瀏覽商品列表 — — 點選商品詳情頁 — — 根據自己的喜好程度諮詢商品客服人員 — — 滿足自己購買意向新增到購物車 — — 對商品進行支付 — — 最後交易成功 — — 商家發貨。
我們計算每個每個步驟的轉化率,看具體是哪個環節出了問題如下圖所示:
透過資料發現“付款後-交易成功”的轉化率很高的,但是“付款-交易成功”環節的轉化率出現了異常,一般來說使用者付款之後很少會出現交易失敗的行為,因此這是一個極度反常的現象!
因此懷疑是由於產品介面的付款功能出現了異常,使用者付款成功後,平臺顯示交易失敗,將錢款退給了使用者,後來經過產品方的確認,證明確實是因為付款介面的BUG引起的訂單下降,透過及時補救,很快訂單量又恢復了正常。