現(xiàn)實與Kaggle的區(qū)別 現(xiàn)實環(huán)境的數(shù)據(jù)分析工作和Kaggle題目之間,最大的區(qū)別在于kaggle上的問題往往非常清晰,。預(yù)測類問題,,你只需要把預(yù)測做的足夠準(zhǔn)確就能拿高分。 但在實際的業(yè)務(wù)環(huán)境中,,你做了一個很牛逼的預(yù)測模型,,換回來的只是業(yè)務(wù)方一句“這個有什么用?” 有時候業(yè)務(wù)方提出的問題也很不靠譜,。提需求的時候說是要分析一個問題的原因,,結(jié)果實際上問題根本就不存在,只是對方的感覺,。 所以如果你在Kaggle上可以混的風(fēng)生水起,,那么只能說你對于確定性問題的解題方法掌握比較好,。 但到了實際業(yè)務(wù)環(huán)境下,識別問題成了一個更重要的能力,。 業(yè)務(wù)人員提的數(shù)據(jù)分析需求往往很雜,,各種千奇百怪的“是不是、有多少,、為什么,、能不能、會不會,,怎么辦”等問題層出不窮,。到底哪些問題可以歸為一類,這類問題又該如何分析,,這是每個數(shù)據(jù)分析師都想知道的,。 我根據(jù)自己的經(jīng)驗和理解,整理了一套定義問題的方法,,分享給大家,。 一個業(yè)務(wù)分析需求的必備要素有哪些? 一個業(yè)務(wù)分析需求,,必備的要素有哪些,? 上一篇提到了一個思考框架,業(yè)務(wù)流,、管理流與數(shù)據(jù)流,。 這里簡單復(fù)習(xí)一下,,一般常見的分析流程: 是什么: 用數(shù)據(jù)流反應(yīng)管理流,,解決“是什么”的問題。留存率是多少,,算高算低,?如果留存率低的話是哪類用戶低? 我一般把常見的細(xì)分分析得出的結(jié)論,,都?xì)w納成“是什么”,。 “為什么購買轉(zhuǎn)化率低?”,,“因為落地頁的轉(zhuǎn)化率低”,。 類似這樣的回答,其實只是對轉(zhuǎn)化率做了細(xì)分,,本質(zhì)上還是“是什么”,。真正的“為什么”是“為什么落地頁的轉(zhuǎn)化率低,用戶到底在想什么,需求是什么,?” 為什么: 用數(shù)據(jù)流反應(yīng)業(yè)務(wù)流,,解決“為什么”的問題。 什么原因造成一部分用戶的留存率低,?是因為需求無法滿足,?還是非目標(biāo)用戶群體? 如果是落地頁轉(zhuǎn)化問題,,那么現(xiàn)在落地頁上的問題是什么,?哪些元素降低了轉(zhuǎn)化率? 這類問題的答案要落實到具體的用戶需求上,。 有時候數(shù)據(jù)可以反應(yīng)用戶的實際使用情況,,比如用戶在落地頁上停留較長,也愿意查看活動規(guī)則,,但是轉(zhuǎn)化率很低,。那么這種情況大概率是用戶被賣點吸引,但是看不懂規(guī)則,,或者實際活動與他的理解不一致,。 很多情況下,數(shù)據(jù)沒法直接反應(yīng)用戶遇到的問題,,必須通過用戶調(diào)研實現(xiàn)。 怎么辦: 在管理流中找對策解決業(yè)務(wù)流的問題,,解決“怎么辦”的問題,。如果是需求無法滿足這部分用戶,那么我們可以怎么解決這個問題,?增加功能還是優(yōu)化現(xiàn)有功能的體驗,? 有時候,這一步并不一定是數(shù)據(jù)分析師來做的,,甚至不是從數(shù)據(jù)上推導(dǎo)的,。上一步的“為什么”如果已經(jīng)找到非常具體的原因,比如“A類用戶流失主要是由于會員到期”,,那業(yè)務(wù)方圍繞著如何促進(jìn)續(xù)費就能改善這一狀況,。 目的: 除了分析的常見流程,還有一個分析的前提——這次分析的目的是什么,。 這個目的往往是改善某一個具體的指標(biāo),。 我雖然經(jīng)常吐槽業(yè)務(wù)人員沒有數(shù)據(jù)驅(qū)動業(yè)務(wù)的思維,但是在KPI問題上,,業(yè)務(wù)人員對數(shù)據(jù)思維往往非常好,。如果做的事情沒辦法用數(shù)據(jù)衡量,對業(yè)務(wù)人員來說價值不大,。 所以:一般來說,,一個數(shù)據(jù)分析需求一共要經(jīng)過四個階段:
常規(guī)的數(shù)據(jù)分析問題類型 最常規(guī)的問題類型,是業(yè)務(wù)方知道前面N個環(huán)節(jié),,需要分析后面的環(huán)節(jié),。 比如最常規(guī)的,,只知道目的,,后續(xù)都需要分析。 用戶運營找到數(shù)據(jù)分析師,,想要做一個專題分析,,主題是如何提升用戶的活躍率。 這個問題的目的很明確——“提升用戶活躍率”,。但是后面的部分就沒那么清楚了,,數(shù)據(jù)分析師可以按照之前提到的四個步驟一步一步地向后推進(jìn)。 首先要做的是“是什么”,,把現(xiàn)有的用戶活躍率的數(shù)據(jù)提取出來,,看一下目前的數(shù)據(jù)表現(xiàn)如何。如果數(shù)據(jù)表現(xiàn)確實不太理想,,那么再看看到底是整體都低,,還是有部分群體特別低。 之后是“為什么”的階段,。如果有部分群體活躍率特別低,,那么這部分用戶為什么活躍率低?他們的需求是什么,? 最后,,針對新用戶的問題,制定對應(yīng)的業(yè)務(wù)動作,。如果發(fā)現(xiàn)這部分群體只使用一些基礎(chǔ)功能,,那么如何引導(dǎo)他們使用高級的功能? 這樣一個完整的分析基本就完成了,。 其中的具體分析細(xì)節(jié)本篇暫時不討論,,放到下一篇再講,這篇主要講一下整個分析思路的框架。 這類問題是知道前面N個環(huán)節(jié),,分析過程都是類似的,,向后分析即可。 驗證猜想型需求 其他的數(shù)據(jù)分析問題,,可以用一個表來歸納,。 大體分為兩類,,一類是有目標(biāo)的,,一類是沒目標(biāo)的。 有目標(biāo)的,,一般是驗證猜想 比如,,知道“目的”和“為什么”。 業(yè)務(wù)方想提升新功能的使用率,,提出一個猜想,。 新上的功能對于新用戶來說理解成本比較高,想做一些優(yōu)化,。 但這只是一個猜想,,甚至連問題本身是否存在都不確定。 這類問題需要把缺失的“是什么”補上,, 1.是什么:用數(shù)據(jù)證明新用戶現(xiàn)有的使用率怎么樣,,如果新用戶使用率已經(jīng)較高,那么這個猜想的基礎(chǔ)就不存在了,。 如果新用戶使用率確實比較低,,那么再驗證新功能是不是理解成本太高。 2.怎么辦:驗證了猜想,,再思考怎么辦。 還有知道“目的”和“怎么辦”的,。 業(yè)務(wù)方想要提升用戶數(shù)量,,然后看到拼多多的微信裂變拉新搞的很成功,我們拉新是不是也可以微信裂變提升新用戶數(shù)呢,? 需要做的步驟: 1.“是什么”:看一下目前的新用戶數(shù),。也許現(xiàn)在的新用戶數(shù)已經(jīng)還不錯了,那是不是還有必要花人力去優(yōu)化拉新環(huán)節(jié),? 2.“為什么”:如果現(xiàn)在的用戶數(shù)上不去,,為什么整體用戶數(shù)上不去?如果因為新用戶的留存和轉(zhuǎn)化很差,,新用戶沒幾個能留下來,,那么工作的重點應(yīng)該是提升留存,而不是拉新。 3.得出結(jié)論:不應(yīng)該采用裂變拉新,,原因是我們的業(yè)務(wù)場景和拼多多不同,,我們現(xiàn)在無法承接新用戶的轉(zhuǎn)化,需要優(yōu)化產(chǎn)品體驗后再做會更好,。 無目標(biāo)的需求 沒目標(biāo)的,,這類就比較坑了。 只知道”為什么“ 這種問題往往是有一些客戶的反饋,,比如用戶反饋一個常用的功能經(jīng)常找不到入口在哪,。 這個反饋比數(shù)據(jù)分析的結(jié)論要準(zhǔn)確多了,數(shù)據(jù)分析最多知道一類人的使用特點是什么,,基本不可能知道用戶到底在想什么,。 產(chǎn)品經(jīng)理拿到這種反饋,需求背景寫起來都理直氣壯了,,這可是客戶的的真實需求,。 分析這種問題,首先得確定目標(biāo),。如果優(yōu)化這個功能的入口,,到底要優(yōu)化哪個指標(biāo)? 是做用戶留存率,,還是功能轉(zhuǎn)化率,? 如果是為了優(yōu)化用戶留存率,那現(xiàn)在留存率是多少,,這個反饋的用戶的留存情況怎么樣,? 會不會這個用戶是一個重度用戶,留存情況非常好,。而常用這類功能的用戶都是重度用戶,,優(yōu)不優(yōu)化這群用戶都會留下來。 那這種反饋優(yōu)先級肯定比較低,。 而如果目標(biāo)是提高功能轉(zhuǎn)化率,,那么看一下目前這個功能的點擊率,看一下是普遍問題還是這個用戶的個別問題,。之后再按順序繼續(xù)分析即可,。 還有一類沒目標(biāo)的需求更坑。 業(yè)務(wù)方看到競品在搞降價促銷活動,,于是提示“我們是不是也可以搞一個降價促銷,?” 這類需求根本沒考慮清楚搞一個這樣的活動目的是什么。是提升銷量嗎,? 也許競品搞這個活動的目的是清庫存,,降低庫存成本,。而你根本沒有庫存壓力,直接照抄最后庫存也沒清掉,,銷售額提升也不明顯,。 如何分析就不贅述了。 總結(jié) 日常的分析需求一般不會超過上述這個分析框架,,拿到分析需求的時候思考一下這個需求目前擁有的要素,,然后從左到右推導(dǎo),可以快速組織分析思路,。 |
|