一、現實與Kaggle的區(qū)別
現實環(huán)境的數據分析工作和Kaggle題目之間,最大的區(qū)別在于Kaggle上的問題往往非常清晰。
預測類問題,你只需要把預測做的足夠準確就能拿高分。
但在實際的業(yè)務環(huán)境中,你做了一個很牛逼的預測模型,換回來的只是業(yè)務方一句“這個有什么用?”
有時候業(yè)務方提出的問題也很不靠譜,提需求的時候說是要分析一個問題的原因,結果實際上問題根本就不存在,只是對方的感覺。
所以如果你在Kaggle上可以混的風生水起,那么只能說你對于確定性問題的解題方法掌握比較好。
但到了實際業(yè)務環(huán)境下,識別問題成了一個更重要的能力。
業(yè)務人員提的數據分析需求往往很雜,各種千奇百怪的“是不是、有多少、為什么、能不能、會不會,怎么辦”等問題層出不窮。
到底哪些問題可以歸為一類?這類問題又該如何分析?這是每個數據分析師都想知道的。
我根據自己的經驗和理解,整理了一套定義問題的方法,分享給大家。
二、一個業(yè)務分析需求的必備要素有哪些?
一個業(yè)務分析需求,必備的要素有哪些?
上一篇提到了一個思考框架,業(yè)務流、管理流與數據流。

這里簡單復習一下,一般常見的分析流程:
1. 是什么
用數據流反應管理流,解決“是什么”的問題。留存率是多少,算高算低?如果留存率低的話是哪類用戶低?
我一般把常見的細分分析得出的結論,都歸納成“是什么”。
“為什么購買轉化率低?”,“因為落地頁的轉化率低”。
類似這樣的回答,其實只是對轉化率做了細分,本質上還是“是什么”。
真正的“為什么”是“為什么落地頁的轉化率低?用戶到底在想什么?需求是什么?”
2. 為什么
用數據流反應業(yè)務流,解決“為什么”的問題。
什么原因造成一部分用戶的留存率低?是因為需求無法滿足?還是非目標用戶群體?
如果是落地頁轉化問題,那么現在落地頁上的問題是什么?哪些元素降低了轉化率?
這類問題的答案要落實到具體的用戶需求上。
有時候數據可以反應用戶的實際使用情況,比如用戶在落地頁上停留較長,也愿意查看活動規(guī)則,但是轉化率很低。
那么這種情況大概率是用戶被賣點吸引,但是看不懂規(guī)則,或者實際活動與他的理解不一致。
很多情況下,數據沒法直接反應用戶遇到的問題,必須通過用戶調研實現。
3. 怎么辦
在管理流中找對策解決業(yè)務流的問題,解決“怎么辦”的問題。
如果是需求無法滿足這部分用戶,那么我們可以怎么解決這個問題?增加功能還是優(yōu)化現有功能的體驗?
有時候,這一步并不一定是數據分析師來做的,甚至不是從數據上推導的;上一步的“為什么”如果已經找到非常具體的原因,比如“A類用戶流失主要是由于會員到期”,那業(yè)務方圍繞著如何促進續(xù)費就能改善這一狀況。
4. 目的
除了分析的常見流程,還有一個分析的前提——這次分析的目的是什么。
這個目的往往是改善某一個具體的指標。
我雖然經常吐槽業(yè)務人員沒有數據驅動業(yè)務的思維,但是在KPI問題上,業(yè)務人員對數據思維往往非常好;如果做的事情沒辦法用數據衡量,對業(yè)務人員來說價值不大。
所以,一般來說,一個數據分析需求一共要經過四個階段:
目的:確定分析的目的,優(yōu)化什么指標。
是什么:確認現在的指標情況“是什么”,問題集中在哪個部分?
為什么:現狀為什么是這樣,用戶的需求是什么?
怎么辦:制定什么樣的對策來優(yōu)化指標。
三、常規(guī)的數據分析問題類型
最常規(guī)的問題類型,是業(yè)務方知道前面N個環(huán)節(jié),需要分析后面的環(huán)節(jié)。

比如最常規(guī)的,只知道目的,后續(xù)都需要分析。
用戶運營找到數據分析師,想要做一個專題分析,主題是如何提升用戶的活躍率。
這個問題的目的很明確——“提升用戶活躍率”。
但是后面的部分就沒那么清楚了,數據分析師可以按照之前提到的四個步驟一步一步地向后推進。
首先要做的是“是什么”,把現有的用戶活躍率的數據提取出來,看一下目前的數據表現如何。
如果數據表現確實不太理想,那么再看看到底是整體都低,還是有部分群體特別低。
之后是“為什么”的階段。如果有部分群體活躍率特別低,那么這部分用戶為什么活躍率低?他們的需求是什么?
最后,針對新用戶的問題,制定對應的業(yè)務動作;如果發(fā)現這部分群體只使用一些基礎功能,那么如何引導他們使用高級的功能?
這樣一個完整的分析基本就完成了。
其中的具體分析細節(jié)本篇暫時不討論,放到下一篇再講,這篇主要講一下整個分析思路的框架。
這類問題是知道前面N個環(huán)節(jié),分析過程都是類似的,向后分析即可。
四、驗證猜想型需求
其他的數據分析問題,可以用一個表來歸納。

大體分為兩類,一類是有目標的,一類是沒目標的。
有目標的,一般是驗證猜想。
比如,知道“目的”和“為什么”。
業(yè)務方想提升新功能的使用率,提出一個猜想。
新上的功能對于新用戶來說理解成本比較高,想做一些優(yōu)化。
但這只是一個猜想,甚至連問題本身是否存在都不確定。
這類問題需要把缺失的“是什么”補上,
1)是什么:用數據證明新用戶現有的使用率怎么樣,如果新用戶使用率已經較高,那么這個猜想的基礎就不存在了。
如果新用戶使用率確實比較低,那么再驗證新功能是不是理解成本太高。
2)怎么辦:驗證了猜想,再思考怎么辦。
還有知道“目的”和“怎么辦”的。
業(yè)務方想要提升用戶數量,然后看到拼多多的微信裂變拉新搞的很成功,我們拉新是不是也可以微信裂變提升新用戶數呢?
需要做的步驟:
“是什么”:看一下目前的新用戶數。也許現在的新用戶數已經還不錯了,那是不是還有必要花人力去優(yōu)化拉新環(huán)節(jié)?
“為什么”:如果現在的用戶數上不去,為什么整體用戶數上不去?如果因為新用戶的留存和轉化很差,新用戶沒幾個能留下來,那么工作的重點應該是提升留存,而不是拉新。
得出結論:不應該采用裂變拉新,原因是我們的業(yè)務場景和拼多多不同,我們現在無法承接新用戶的轉化,需要優(yōu)化產品體驗后再做會更好。
五、無目標的需求
沒目標的,這類就比較坑了;只知道”為什么“這種問題往往是有一些客戶的反饋,比如用戶反饋一個常用的功能經常找不到入口在哪。
這個反饋比數據分析的結論要準確多了,數據分析最多知道一類人的使用特點是什么,基本不可能知道用戶到底在想什么。
產品經理拿到這種反饋,需求背景寫起來都理直氣壯了,這可是客戶的的真實需求。
分析這種問題,首先得確定目標;如果優(yōu)化這個功能的入口,到底要優(yōu)化哪個指標?是做用戶留存率,還是功能轉化率?如果是為了優(yōu)化用戶留存率,那現在留存率是多少?這個反饋的用戶的留存情況怎么樣?會不會這個用戶是一個重度用戶,留存情況非常好。
而常用這類功能的用戶都是重度用戶,優(yōu)不優(yōu)化這群用戶都會留下來;那這種反饋優(yōu)先級肯定比較低。
而如果目標是提高功能轉化率,那么看一下目前這個功能的點擊率,看一下是普遍問題還是這個用戶的個別問題;之后再按順序繼續(xù)分析即可。還有一類沒目標的需求更坑。
業(yè)務方看到競品在搞降價促銷活動,于是提示“我們是不是也可以搞一個降價促銷?”
這類需求根本沒考慮清楚搞一個這樣的活動目的是什么,是提升銷量嗎?
也許競品搞這個活動的目的是清庫存,降低庫存成本;而你根本沒有庫存壓力,直接照抄最后庫存也沒清掉,銷售額提升也不明顯;如何分析就不贅述了。
六、總結
日常的分析需求一般不會超過上述這個分析框架,拿到分析需求的時候思考一下這個需求目前擁有的要素,然后從左到右推導,可以快速組織分析思路。
至于每一個環(huán)節(jié)的具體做法,歡迎關注,等下一篇詳細說說。
歡迎關注“三元方差”公眾號。