資料分析在網際網路公司的重要性不言而喻,隨著社會對資料分析人才需求量的增大,越來越多的人在朝資料分析的方向發展。但很多人談到資料分析時首先想到的是資料分析工具,如Python、SQL等,卻忽略了資料分析思維的培養。
資料分析思維決定了從哪些方面分析,而資料分析工具主要是服務於資料分析思維。簡單地說,資料分析思維決定了分析方向,而資料分析工具只是幫你達到目的地。
一個連分析的方向都搞不清楚的人,即使透過資料分析給出了一些結論,這些結論也很難讓人信服,因為這些一般都是片面的,當然更談不上對業務的指導。
本文我就透過一個案例來教大家掌握五個關鍵的資料分析思維。
案例:某電商公司最近一個月的GMV環比增長10%,但本月用於銷售的成本支出卻環比增長50%,分析GMV環比增長率低於銷售成本增長率的原因。
一、 因素分解法
因素分解法,顧名思義,就是分解影響目標的因素。
案例中,影響GMV的因素可以從多個維度拆分:
1.渠道維度:總體GMV=渠道1 GMV + 渠道2 GMV +…+渠道n GMV
2.城市(子公司)維度:總體GMV=城市1 GMV + 城市2 GMV +…+城市n GMV
3.GMV = 訂單量*客單價
4.訂單量 = 活躍使用者數*下單率
5.活躍使用者數 = 新增活躍使用者數 + 活躍的老使用者數
顯然,訂單量、活躍使用者數、新增活躍使用者數、活躍的老使用者數等每一個因素都可以再分解到渠道和城市維度,而每個城市也可以再分解到渠道維度。這就是交叉因素分析法。
每一個因素的變化如何分析呢?這就需要用到對比法。
二、 對比法
對比法主要有環比上期、同比去年同期兩個比較基準,當然也可以根據業務情況,確定其他比較基準。
對比法可以發現數據變化的規律,並且增長率可以定量反映資料變化情況。不同時期的同比增長率可以對比,環比增長率也可以再對比。
如案例中,若同比去年,發現去年11月GMV的同比增長率為20%,而今年的同比增長率只有5%,顯然今年11月份的增長率同比去年11月份變低了。
提到對比,不得不提到值得注意的一點:趨勢固然重要,但不要只看大致趨勢,要分析具體的變化比率。資料分析不是告訴別人差不多,而是要告訴別人差多少。
三、 分類法
在分解了影響目標的因素,並分析了各因素指標的增長率以後,我們可以發現有一些城市、業務單元或者其他物件(如使用者)多個關鍵指標都表現比較好,或者其中一個關鍵指標表現好,但其他指標表現差。對這些物件我們需要進一步分類,區分出高價值物件、重點發展物件、重要挽留物件和一般維持物件。
如案例中,我們進一步分析發現:
部分使用者下單頻率很高,客單價也很高;部分使用者下單頻率比較低,但客單價很高;部分使用者下單頻率很高,但客單價低;還有部分使用者下單頻率和客單價都很低。
對以上四類使用者,我們可以用最簡單直觀的四象限法分類:
在上述四象限分類的基礎上,我們還可以加入第三個維度,最近一次消費時間距今的天數,以判斷使用者可能流失的機率(最近一次消費時間距今的天數越長,越容易流失),這就是常用的RFM模型。
四、 二八分佈法則
有一個玩笑說:如果一種資料的分佈不服從常見的正態分佈、泊松分佈、二項分佈的話,那它就接近服從二八分佈了。
這個玩笑雖然不一定百分之百能概括所有的資料分佈型別,但在我們常見的與錢相關的資料分佈中,很多都服從二八分佈。如:世界上20%的人掌握了80%的財富,一個公司20%的客戶貢獻了80%的收入,一個公司20%的員工為企業發展貢獻了80%的力量……
二八分佈法則對資料分析師的啟示是:重點研究貢獻80%的收入的20%使用者,找出這些使用者的特徵,再把其他潛在使用者培養成這20%的使用者,企業就可以越做越大了。所以,作為一名資料分析師,先集中精力把這20%的重要使用者研究清楚,再研究其他使用者吧。
透過以上四種思維方法,你已經把案例中下過訂單、貢獻收入的使用者基本分析清楚了。
但除了下過訂單的使用者,還有一部分使用者是沒有下過訂單的,這部分使用者為什麼沒有下過訂單呢?
我們需要透過漏斗法來分析使用者從登入平臺到最後下單的轉化率。
五、 漏斗法
漏斗法主要目的是檢視目標事件整個過程中每一步的轉化率以及整個事件最終的轉化率,發現使用者流失最嚴重的環節,以最佳化程式和提高整體轉化率。
如:產品使用過程中每一步的轉化率,可以幫助分析產品設計環節的優劣;運營活動每一步的轉化率,可以分析運營活動各個環節設計的優劣。
漏斗法在網際網路公司的資料分析中經常被用到,並且經常透過埋點資料分析頁面曝光和點選的PV、UV。
案例中,電商漏斗可用如下圖表示,註冊、登入一般是新使用者才有的環節,對老使用者而言則是啟動、瀏覽商品直至最後支付成功的環節。
當然,漏斗中每一步的轉化率指標同樣需要結合前面提到的對比法進行分析,如分析同一時期轉化率的變化情況,對比分析不同城市或使用者群體每一步的轉化率等。
最後,每一種資料分析思維不是孤立存在的,需要結合交叉使用,以發現問題和解決問題為最終目的。
最後分享一些BI建設、資料分析相關的優質資料:
超連結