<<<前言>>>
跟數(shù)據(jù)打交道已經(jīng)上十年了,在管理業(yè)務(wù)、產(chǎn)品運營、風(fēng)險識別、數(shù)據(jù)產(chǎn)品等方面有過一些實踐經(jīng)驗,愛總結(jié)的邏輯Go決定把日常的文本總結(jié)短文化,整理成體系,歡迎拍磚,更歡迎一起研討:
系列一:風(fēng)險與數(shù)據(jù)的邏輯
系列二:業(yè)務(wù)管理背后的數(shù)據(jù)故事
系列三:產(chǎn)品運營與數(shù)字游戲
系列四:如何打造數(shù)據(jù)產(chǎn)品
文 | 愛總結(jié)的邏輯Go
閱 | 完整閱讀需要8分鐘
都說進入中國人口紅利已經(jīng)在消失,我們已經(jīng)進入到互聯(lián)網(wǎng)的下半場。在上半場,流量爆發(fā)助長了互聯(lián)網(wǎng)公司的快速發(fā)展,你甚至不需要知道網(wǎng)絡(luò)另一端是個什么樣的人;下半場,互聯(lián)網(wǎng)公司已經(jīng)不新鮮了,大部分公司已經(jīng)互聯(lián)網(wǎng)化,每個消費者都正在被數(shù)字化,標(biāo)簽化~~
這兩年引領(lǐng)下半場發(fā)展的是那些在講“大數(shù)據(jù)”“賦能”的企業(yè),有數(shù)據(jù)有用戶的企業(yè)。
通過大數(shù)據(jù)告訴政府該如何智慧地管理交通,規(guī)劃地鐵站,做城市發(fā)展規(guī)劃。
通過消費數(shù)據(jù)分析,告訴企業(yè)該在什么時間生產(chǎn)什么產(chǎn)品,以最大化地滿足用戶的需求。
通過生活大數(shù)據(jù)告訴我們餐飲企業(yè),甚至房地產(chǎn)企業(yè)該如何選址。
如果說互聯(lián)網(wǎng)的上半場是粗曠運營,因為有流量紅利不需要考慮細節(jié)。那么下半場,精細化運營將是長久的主題。有數(shù)據(jù),有數(shù)據(jù)分析能力才能讓用戶得到更好的體驗。
所以,用戶是根本,也是數(shù)據(jù)分析的出發(fā)點。產(chǎn)品設(shè)計用戶在線的交互方式,也是數(shù)據(jù)生產(chǎn)的方式。
<<<用戶畫像的準(zhǔn)則>>>
假如你受雇一家賣羊肉串的公司,老板擔(dān)心現(xiàn)在競爭越來越激烈了,要想做好得知道顧客喜歡什么。于是上班第一天,老板問你:“你能不能分析一下用戶數(shù)據(jù),給咱們公司的羊肉串業(yè)務(wù)賦能?。俊?/p>
“老板啊, 咱們賣羊肉串的,做數(shù)據(jù)挖掘沒用啊?!?估計老板聽后,晚上就把你開了!
那應(yīng)該怎么做呢?
首先就是將自己企業(yè)的用戶畫像做個白描,分析用戶“都是誰”“從哪來”“要去哪”。
換一種回答:“老板,您需要的是用戶畫像,畫像建模是個系統(tǒng)的工程,我們需要解決三個問題。第一呢,就是用戶從哪里來,這里我們需要統(tǒng)一標(biāo)識用戶ID,方便我們對用戶后續(xù)行為進行追蹤。我們要了解這些羊肉串的用戶從哪里來,他們是為了聚餐,還是自己吃宵夜,這些場景我們都要做統(tǒng)計分析。第二呢,這些用戶是誰?我們需要對這些用戶進行標(biāo)簽化,方便我們對用戶行為進行理解。第三呢,就是用戶要到哪里去?我們要將這些用戶畫像與我們的業(yè)務(wù)相關(guān)聯(lián),提升我們的轉(zhuǎn)化率,或者降低我們的流失率?!?/p>
相信你的老板聽到這里,一定會給你豎起大拇指,說:“不錯,需要什么資源,隨時找我就行?!?/p>
就像上圖手繪的內(nèi)容,我們再做一個梳理:
首先,為什么要設(shè)計唯一標(biāo)識?
用戶唯一標(biāo)識是整個用戶畫像的核心。一個APP,把“從用戶開始使用APP到下單到售后整個所有的用戶行為”進行串聯(lián),這樣就可以更好地去跟蹤和分析一個用戶的特征。
設(shè)計唯一標(biāo)識可以是:用戶編碼、用戶名、注冊手機號、郵箱、設(shè)備號、CookieID等。
其次,給用戶打標(biāo)簽。
標(biāo)簽并不是越多越好,不同的產(chǎn)品,標(biāo)簽的選擇范圍也不同,如果以電商企業(yè)為例,可以區(qū)分四個維度進行標(biāo)簽劃分,進行“用戶消費行為分析”:
1、用戶標(biāo)簽:它包括了性別、年齡、地域、收入、學(xué)歷、職業(yè)等,這些包括了用戶的基礎(chǔ)屬性。
2、消費標(biāo)簽:消費習(xí)慣、購買意向、是否對促銷敏感。這些統(tǒng)計分析用戶的消費習(xí)慣,有利于了解用戶消費偏好,針對性地推薦商品。
3、行為標(biāo)簽:時間段、頻次、時長、訪問路徑。這些是通過分析用戶行為,來得到他們使用APP的習(xí)慣。
4、內(nèi)容分析:對用戶平時瀏覽的內(nèi)容,尤其是停留時間長、瀏覽次數(shù)多的內(nèi)容進行分析,分析出用戶對哪些內(nèi)容感興趣,比如,金融、娛樂、教育、體育、時尚、科技等。
<<<標(biāo)簽體系的建立>>>
用戶畫像是現(xiàn)實世界中的用戶數(shù)學(xué)建模,我們正是將海量數(shù)據(jù)進行標(biāo)簽化,來得到精準(zhǔn)的用戶畫像,從而為用戶經(jīng)營更精準(zhǔn)地解決問題。
想想,當(dāng)你有了用戶畫像,可以為用戶經(jīng)營帶來什么業(yè)務(wù)價值呢?
可以從用戶生命周期的三個階段來劃分畫像價值:獲客、粘客、留客。
1、獲客:如何進行拉新,通過更精準(zhǔn)的營銷獲取客戶。
2、粘客:個性化推薦,搜索排序,場景運營等。
3、留客:流失率預(yù)測,分析關(guān)鍵節(jié)點降低流失率。
如果按照數(shù)據(jù)流處理的階段來劃分用戶畫像建模的過程,可以分為數(shù)據(jù)層、算法層和業(yè)務(wù)層。你會發(fā)現(xiàn)在不同的層,都需要打上不同的標(biāo)簽。
數(shù)據(jù)層指的是用戶消費行為里的標(biāo)簽。也是“事實標(biāo)簽”,作為數(shù)據(jù)客觀的記錄。
算法層指的是透過這些行為算出的用戶建模。可以打上“模型標(biāo)簽”,作為用戶畫像的分類標(biāo)識。
業(yè)務(wù)層指的是獲客、粘客、留客的手段??梢源蛏稀?strong>預(yù)測標(biāo)簽”,作為業(yè)務(wù)關(guān)聯(lián)的結(jié)果。
標(biāo)簽化的流程,就是通過數(shù)據(jù)層的“事實標(biāo)簽”,在算法層進行計算,打上“模型標(biāo)簽”的分類結(jié)果,最后指導(dǎo)業(yè)務(wù)層,得出“預(yù)測標(biāo)簽”。
隨著現(xiàn)在用戶交互的海量增長,數(shù)據(jù)的體量也在不斷擴大,“事實標(biāo)簽”基于數(shù)據(jù)層做記錄和管理,也需要根據(jù)數(shù)據(jù)粒度和應(yīng)用場景做分層:
1、明細層數(shù)據(jù):以“日”為數(shù)據(jù)粒度,直接從各個業(yè)務(wù)數(shù)據(jù)表、日志數(shù)據(jù)表、埋點數(shù)據(jù)表抽取用戶每天的每一次行為,按固定表結(jié)構(gòu)插入相關(guān)表中,在此過程中不對數(shù)據(jù)做任何匯總、統(tǒng)計類的處理??梢暈閿?shù)據(jù)倉庫中ODS層數(shù)據(jù)。
2、統(tǒng)計中間層數(shù)據(jù):以“用戶”為數(shù)據(jù)粒度,對明細層的全量歷史數(shù)據(jù)進行統(tǒng)計加工、匯總計算,可視為數(shù)據(jù)倉庫中DW層數(shù)據(jù)。
3、應(yīng)用層數(shù)據(jù):以“用戶”為數(shù)據(jù)粒度,對統(tǒng)計中間層數(shù)據(jù)做進一步挖掘處理,處理過程中要考慮業(yè)務(wù)應(yīng)用場景,關(guān)聯(lián)行為權(quán)重、標(biāo)簽權(quán)重等。應(yīng)用層數(shù)據(jù)輸出后可支持產(chǎn)品應(yīng)用。應(yīng)用層數(shù)據(jù)可視為數(shù)據(jù)倉庫中DM層數(shù)據(jù)。
開發(fā)出的用戶畫像相關(guān)寬表及明細標(biāo)簽表,按應(yīng)用場景一般分為用戶人口屬性畫像、用戶個性化標(biāo)簽、各業(yè)務(wù)線用戶畫像、用戶偏好畫像和用戶群體屬性畫像等。現(xiàn)在各數(shù)據(jù)公司高度重視的關(guān)系網(wǎng)絡(luò)圖譜,也是基于此基礎(chǔ)上建立風(fēng)險庫關(guān)系網(wǎng)絡(luò)、欺詐度關(guān)系網(wǎng)絡(luò)以及高價值關(guān)系網(wǎng)絡(luò)、高成長性群體網(wǎng)絡(luò)等。
<<<用戶標(biāo)簽化的應(yīng)用>>>
當(dāng)有了“用戶消費行為分析”的標(biāo)簽之后,就可以更好地理解業(yè)務(wù)了。
比如一個經(jīng)常購買沙拉的人,一般很少吃夜宵;同樣,一個經(jīng)常吃夜宵的人,吃小龍蝦的概率可能遠高于其他人。這些結(jié)果都是通過數(shù)據(jù)挖掘中的關(guān)聯(lián)分析得出的。
有了這些數(shù)據(jù),就可以預(yù)測用戶的行為。
比如,一個用戶購買了“月子餐”后,購買嬰兒用品的概率也會增大。
具體在業(yè)務(wù)層上,可以基于標(biāo)簽產(chǎn)生哪些業(yè)務(wù)價值呢?
1、在獲客上,可以找到優(yōu)勢的宣傳渠道,如何通過個性化的宣傳手段,吸引有潛力需求的用戶,并刺激其轉(zhuǎn)化。
2、在粘客上,如何提升用戶的單價和消費頻次,方法可以包括購買后的個性化推薦、針對優(yōu)質(zhì)用戶進行優(yōu)質(zhì)高價商品的推薦、以及重復(fù)購買,比如通過紅包、優(yōu)惠等方式激勵對優(yōu)惠敏感的人群,提升購買頻次。
3、在留客上,預(yù)測用戶是否可能會從平臺上流失。在營銷領(lǐng)域,關(guān)于用戶留存有一個觀點——如果將客戶流失率降低5%,公司利潤將提升25%-85%??梢钥闯隽舸媛适嵌嗝吹闹匾?。用戶流失可能會包括多種情況,比如用戶體驗、競爭對手、需求變化等,通過預(yù)測用戶的流失率可以大幅降低用戶留存的運營成本。
<<<抽象思維的重要性>>>
鍛煉自己的抽象能力,將繁雜的事務(wù)簡單化
上面講了很多一般情況考慮的,也不能忽略特殊情況,用戶行為也會隨著營銷的節(jié)奏產(chǎn)生異常值。比如雙十一,激增的大量訂單,要考慮異常值的處理。
總之,數(shù)據(jù)量是龐大的,會存在各種各樣的使用情況,光是分析EB級別的大數(shù)據(jù),就要花很長的時間。
但最終目的不是處理這些數(shù)據(jù),而是理解、使用這些數(shù)據(jù)挖掘的結(jié)果。對數(shù)據(jù)的標(biāo)簽化能讓我們快速理解一個用戶,一個商品,乃至一個爆款文案內(nèi)容的特征,從而方便理解和使用數(shù)據(jù)。
用戶畫像最終的目的是了解產(chǎn)品用戶是誰?是怎樣的?有什么共性的特征?他們需要什么? 產(chǎn)品的潛在用戶在哪里?
帶著問題,進行抽象化的提煉,通過標(biāo)簽組合算法的運用和挖掘,在互聯(lián)網(wǎng)下半場后流量時代是至關(guān)重要的。
今天就用戶畫像標(biāo)簽化的話題先講到這里吧,這幾天在忙著整理課件,把數(shù)據(jù)運營的方法體系進行梳理,歸納總結(jié)應(yīng)用到產(chǎn)品價值提升上,是件很有意思的事情。 從十年前的Deck Data講起,到今天全生命周期數(shù)據(jù)化的演變升級,會有很多可以分享的故事點~~