相關(guān)精彩專(zhuān)題鏈接: 數(shù)據(jù)成就更好的你
一、什么是用戶(hù)畫(huà)像?
用戶(hù)畫(huà)像就是根據(jù)用戶(hù)屬性、業(yè)務(wù)場(chǎng)景和用戶(hù)行為等數(shù)據(jù)將用戶(hù)信息標(biāo)簽化(即給用戶(hù)貼“標(biāo)簽”)。
二、用戶(hù)畫(huà)像的應(yīng)用?
活動(dòng)營(yíng)銷(xiāo)、用戶(hù)統(tǒng)計(jì)、個(gè)性化推薦、廣告系統(tǒng)、內(nèi)容推薦、興趣偏好都是基于用戶(hù)畫(huà)像的應(yīng)用。
三、如何構(gòu)建用戶(hù)畫(huà)像?
1.需求調(diào)研,輸出對(duì)應(yīng)的需求文檔
一般而言,用戶(hù)畫(huà)像的服務(wù)對(duì)象包括運(yùn)營(yíng)人員、客服、數(shù)據(jù)分析人員等。不同業(yè)務(wù)方對(duì)用戶(hù)畫(huà)像的需求有不同的側(cè)重點(diǎn)。
對(duì)于運(yùn)營(yíng)人員來(lái)說(shuō),他們需要分析用戶(hù)的特征、定位用戶(hù)行為偏好,做商品或內(nèi)容的個(gè)性化推送以提高轉(zhuǎn)化率,所以畫(huà)像的側(cè)重點(diǎn)落在用戶(hù)個(gè)人行為偏好;
對(duì)于數(shù)據(jù)分析人員來(lái)說(shuō),他們需要分析用戶(hù)行為特征,做好用戶(hù)的流失預(yù)警工作,還可根據(jù)用戶(hù)的消費(fèi)偏好做更有針對(duì)性的精準(zhǔn)營(yíng)銷(xiāo)。
2.建立標(biāo)簽體系
根據(jù)調(diào)研的需求,建立對(duì)應(yīng)的標(biāo)簽體系、并對(duì)方案的可行性進(jìn)行溝通與確認(rèn),輸出對(duì)應(yīng)的文檔。在方案中應(yīng)該明確畫(huà)像應(yīng)用場(chǎng)景、最終開(kāi)發(fā)出的標(biāo)簽內(nèi)容、與各業(yè)務(wù)場(chǎng)景相關(guān)的數(shù)據(jù)口徑、涉及到的數(shù)據(jù)庫(kù)與表,應(yīng)用實(shí)施流程等。
梳理標(biāo)簽分類(lèi)時(shí),盡可能按照MECE原則,相互獨(dú)立,完全窮盡。
123.jpg
3.數(shù)據(jù)的ETL處理
數(shù)據(jù)處理人員從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉(cāng)庫(kù)模型,將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。
相關(guān)的案例可參考:HIVE大數(shù)據(jù)實(shí)戰(zhàn)項(xiàng)目---用戶(hù)行為分析
4.數(shù)據(jù)建模
數(shù)據(jù)建模是指通過(guò)對(duì)用戶(hù)屬性、業(yè)務(wù)場(chǎng)景、用戶(hù)行為等數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析和預(yù)測(cè),為用戶(hù)打上對(duì)應(yīng)的標(biāo)簽。
標(biāo)簽的分類(lèi):事實(shí)標(biāo)簽、模型標(biāo)簽、預(yù)測(cè)標(biāo)簽
事實(shí)標(biāo)簽。從原始數(shù)據(jù)中提取,基于統(tǒng)計(jì)得到。
例如:性別、年齡、城市、新增用戶(hù)、活躍次數(shù)等字段可以從用戶(hù)注冊(cè)數(shù)據(jù)、用戶(hù)訪問(wèn)數(shù)據(jù)中統(tǒng)計(jì)得到。模型標(biāo)簽。沒(méi)有對(duì)應(yīng)數(shù)據(jù),需要定義規(guī)則,建立模型來(lái)計(jì)算得出標(biāo)簽實(shí)例。
例如:對(duì)平臺(tái)上“消費(fèi)活躍”用戶(hù)這一口徑的定義為近30天交易次數(shù)>=2。規(guī)則類(lèi)標(biāo)簽的規(guī)則確定由運(yùn)營(yíng)人員和數(shù)據(jù)人員共同協(xié)商確定。預(yù)測(cè)標(biāo)簽。參考已有事實(shí)數(shù)據(jù),來(lái)預(yù)測(cè)用戶(hù)的行為或偏好,該類(lèi)標(biāo)簽通過(guò)數(shù)據(jù)挖掘產(chǎn)生。
例如:根據(jù)一個(gè)用戶(hù)的行為習(xí)慣判斷該用戶(hù)是男性還是女性,根據(jù)一個(gè)用戶(hù)的消費(fèi)習(xí)慣判斷其對(duì)某商品的偏好程度。建模涉及的算法:相似度計(jì)算;分類(lèi)、聚類(lèi)計(jì)算;文本挖掘算法;預(yù)測(cè)算法;推薦算法等
相關(guān)的建模案例可參考:K-means聚類(lèi)分析案例---電信客戶(hù)細(xì)分
5.畫(huà)像模型的發(fā)布和效果跟蹤
用戶(hù)畫(huà)像建立是一個(gè)持續(xù)優(yōu)化的過(guò)程,需不斷調(diào)整模型及相關(guān)權(quán)重配置。用戶(hù)畫(huà)像從原始數(shù)據(jù)輸入到模型應(yīng)用等一系列的流程可用下圖進(jìn)行概述:
image.png
- 數(shù)據(jù)經(jīng)ETL處理后,集中存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中;
- 經(jīng)過(guò)對(duì)數(shù)據(jù)的建模、挖掘、分析建立用戶(hù)畫(huà)像模型;
- 最終將建好用戶(hù)畫(huà)像的數(shù)據(jù)接口調(diào)用到BI報(bào)表、經(jīng)營(yíng)分析、精準(zhǔn)營(yíng)銷(xiāo)、個(gè)性化推薦等各系統(tǒng)模塊

