數(shù)據(jù)已經(jīng)成為現(xiàn)代企業(yè)越來越重視的資源,與數(shù)據(jù)相關(guān)的職位一般有數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師、數(shù)據(jù)建模師、數(shù)據(jù)產(chǎn)品經(jīng)理等,那么,平時的知識積累該如何進行呢?除了專業(yè)知識以外,還需要哪方面的知識?
一、根本思路
我們知道,對于公司而言,工作就是創(chuàng)造利益的過程,如果不能得利,那離破產(chǎn)也不遠了,所以,在日常工作中,如何把工作利益最大話,就是我們的根本思路。
利益
既然是如此,那么利益一般來源于哪些方面呢?從時間維度來看,一為短期利益,二為長期利益,短期指得是時間跨度在十年之內(nèi),比如營銷方式的改進提高業(yè)績,通過科學得分析來控制成本等,長期利益則最長可達百年,這個時候就必須要注重品牌的構(gòu)建,努力把公司打造成百年老店,基業(yè)長青。
思路
我們的目標有了,就是從長遠利益出發(fā),把活干好,一步一步走,一件事接著一件事干,那么,具體到干活,我們又該以什么樣的思維方式去應(yīng)對呢?我們在平常看書的過程中,經(jīng)常會看到某某思想,當我們看到這些字眼時,心里不自覺就會覺得,好厲害,這就是思想的魅力,只有在掌握解決問題的思路后,才能有的放矢得進行。我們中國古代講“學習”,學什么習呢?學得就是生活習性,學怎么去辦事,學怎么去說話,進而學怎么去生存,這也是“學生”的來歷。
方法
所以,對于任何一個人來講,學就要學到解決思路,而這個思路背后由思想決定,比如我們遇到某件棘手的事,該如何解決?第一步肯定是分析問題的矛盾,看看主要矛盾在什么地方,是資源不夠,是時間不夠,還是投入不夠等,第二步就是解決問題需要哪些條件,這些條件是否具備?拿一件具體的事來講,比如現(xiàn)在網(wǎng)站流量下來了,領(lǐng)導(dǎo)批示,看看做什么事可以把流量搞上去?我們就要分析,主要矛盾在哪?是偶然還是持續(xù)降低?如果是偶然得,跟當前的發(fā)展環(huán)境有沒有關(guān)系?如是持續(xù),是不是網(wǎng)站的主營業(yè)務(wù)與客戶的需求脫節(jié)了?還是內(nèi)容、排版、字體、顏色等不夠吸引人?接下來為了提高流量,是要多做宣傳,多布渠道以引流?還是改進網(wǎng)站來留住老客戶?如果要做這些,領(lǐng)導(dǎo)支持有多高,起他部門同事合作程度有多高等等。
二、分析基礎(chǔ)
一般分析的基礎(chǔ)以數(shù)學為主,特別是現(xiàn)代的常見挖掘方法,更是以矩陣和概率論為基礎(chǔ),因此,掌握好這兩門數(shù)學基礎(chǔ),是至關(guān)重要得!比如我們在R語言里的處理單位,就是以矩陣為主,做標準化處理,做AB測試時,利用方差分析,確定效果的變化是由于本身改動造成得還是概率性得波形造成的等。
概率
概率論的研究對象是樣本,主要想法是用樣本去推測全體,指標一般包含均值、極值、中位數(shù)、眾數(shù)、頻數(shù),標準差、方差等,這些指標衡量樣本的基本情況,也是我們研究樣本的第一步;樣本的分布包含正態(tài)分布、泊松分布、二次分布等,一般根據(jù)大數(shù)定理及中心極限定理,將大樣本的分布近似成正態(tài)分布,可以按照正態(tài)分布的規(guī)律去分析;樣本估計包含點估計、參數(shù)估計以及區(qū)間估計等,一般置信空間以95%為主,還有以p值為中心的假設(shè)檢驗,這個在下面的分析方法中常見。
所以,掌握好概率論是基礎(chǔ),只有把每個指標的含義都理解清楚了,才能在分析業(yè)務(wù)時,不至于走錯路。找一本大學常見的數(shù)理統(tǒng)計課本,就可以掌握這些概念。
分析方法
常見的挖掘方法包含分類預(yù)測、聚類、關(guān)聯(lián)和時序分析等。其中分類預(yù)測占據(jù)了挖掘的主要部分,我們在常見的業(yè)務(wù)分析中,分類是人類學習的本能,當我們面對繁瑣的信息時,第一反應(yīng)就是歸類,比如信用違約與否,天氣預(yù)報,銷量的高低等,都可以歸到分類的情況里。而聚類則常用于客戶價值分類、市場細分等,關(guān)聯(lián)算法則常見于推薦等。這些方法會放到以后的文章里相信說明。
業(yè)務(wù)水平
不懂業(yè)務(wù)的分析員不是一個好分析員,哪怕一個人很精通各種模型,但是他不懂業(yè)務(wù),就很難做出對公司真正有推動力的分析,我在之前的公司就遇到過這樣的團隊,做了一個多月,竟然不知道為何要建立最終的因變量指標,就如分析航空公司的客戶價值,就必須對飛行信息有深入的了解,在選擇消費金額模型時,不能按照簡單得花了多少錢來看,因為一個短程商務(wù)座和一個長程普通座想對航空公司的價值是不一樣的。因此,在做數(shù)據(jù)分析時,一定要把相關(guān)的業(yè)務(wù)指標消化透。
三、相關(guān)工具
俗話說,“欲工其事,必善其器”,所以在做數(shù)據(jù)分析時,必須要求我們掌握一些工具,按重點我分為入門級Excel,登堂級Spss,入室級R/Python,中間的連接通道就是SQL,當然,在工作之余,仍要接觸一些數(shù)據(jù)倉庫之類的知識,或者對可視化感興趣得,也可以學習echarts。
R or Python?
很多同學在學習到這里的時候,不知道該學習哪種語言,其實,就平時工作中得數(shù)據(jù)分析而言,兩種語言都可應(yīng)付,而且兩種語言都是面向?qū)ο蟮木幊陶Z言,學習成本大致相同,兩種語言不同得是,R更側(cè)重于統(tǒng)計分析,而python能干得事情則比較多,爬蟲、分析、可視化更高大上等,而且python是萬能膠水,是常用腳本語言之一,以后的系列文章會介紹R的相關(guān)知識。
四、數(shù)據(jù)產(chǎn)品
數(shù)據(jù)產(chǎn)品是近幾年來剛出來的新概念,也有很多成功案例,就我之前所做的工作來看,有數(shù)據(jù)新聞,有XX大數(shù)據(jù)平臺,有XX分析平臺等,一款產(chǎn)品能不能成功,取決于很多因素,至少當時我們做得數(shù)據(jù)新聞就沒有成功,失敗的原因,總結(jié)來說,仍是市場需求不旺盛,盲目跟從,在資本推動下,做了一次嘗試,那么,數(shù)據(jù)產(chǎn)品如果要成功,它應(yīng)該具備哪些因素呢?
需求
這一塊是根本,在做一款產(chǎn)品前,應(yīng)該用各種辦法,或調(diào)研,或分析,大致估算現(xiàn)在此需求的人數(shù)有多少,愿意為此付費的又有多少,客戶的特征是否明顯?是紅海還是藍海,若有競爭對手,他們的市場份額是多少?競爭力強不強?倘若這塊蛋糕確實還有可分的余地,那么再進入不遲。
迭代
迭代是產(chǎn)品成功的保證,實事求是是解決痛點的最佳態(tài)度,一款產(chǎn)品好不好,能不能叫賣,必須把它扔在市場上去接受考驗,剛開始功能可能不用多,只要含有核心功能就可以,而且一款產(chǎn)品,賣點最好控制在兩個以內(nèi),至于剩下的功能、板式等,可以根據(jù)后續(xù)的市場反饋逐步增加,沒有任何一款產(chǎn)品,剛出來就會把所有功能都加上去。
公司支持
這里包含三個層面,第一,此款產(chǎn)品在公司的戰(zhàn)略規(guī)劃中,起什么作用,是排頭兵攻城略地,是戰(zhàn)略儲備以做轉(zhuǎn)型需要,還是煙霧彈忽悠敵手?第二,高層對產(chǎn)品的態(tài)度,允許犯錯的次數(shù),允許盈利的時間,都會對產(chǎn)品的質(zhì)量和產(chǎn)出有影響;第三,同事的支持,比如一款數(shù)據(jù)產(chǎn)品,可能牽扯到的職位有需求分析師,他們掌控需求的規(guī)模和緊迫程度,數(shù)據(jù)分析師,該放哪些指標,哪些該放到關(guān)鍵位置,哪些可以隱藏等,數(shù)據(jù)挖掘/建模師,一些綜合性的指標,特別牽扯到實用的模型時就需要這兩個部門的人合作才能做出來,數(shù)據(jù)采集部門的同事,他們負責抓去數(shù)據(jù),存儲數(shù)據(jù),美工部門的同事,他們負責產(chǎn)品的形象設(shè)計,最終還需要產(chǎn)品經(jīng)理,統(tǒng)籌規(guī)劃,保證項目的進度等,若這些部門的同事都彼此熟悉,合作愉快,那么一款成功產(chǎn)品的誕生,就有了成功的可能性。
其他感悟
做為一名數(shù)據(jù)分析人員,光關(guān)注本身的技術(shù)是提高不了自己的,除了自己的專業(yè)書以外,如國際國內(nèi)形勢、政策法規(guī)、國家戰(zhàn)略、各國歷史、傳統(tǒng)文化、經(jīng)濟金融、心理學、社會學、甚至詩詞歌賦都可以涉獵,這些可以充分保證在分析問題的時候,不會局限于某一個點,而是會充分聯(lián)想,視野開闊得去看待問題,以一種發(fā)展的眼光去迎接挑戰(zhàn),至于這一章談到的各類內(nèi)容,我會在后續(xù)的文章中推薦一些我看過的書。
做一個知識廣闊,視野開闊,心胸亦寬廣的人,所有問題,最終都是人的問題,現(xiàn)代企業(yè)里,產(chǎn)品要懂數(shù)據(jù),數(shù)據(jù)要懂產(chǎn)品,所謂的數(shù)據(jù)分析師、建模師、挖掘師、產(chǎn)品經(jīng)理職責的界限越來越模糊,大家的共同目標就是把利潤提上去,如此相得益彰,方能基業(yè)常青!