22####[Qunar]用戶畫像構建策略及應用實踐

【用戶畫像】Qunar用戶畫像構建策略及應用實踐-搜狐 http://mt.sohu.com/20161125/n474154155.shtml

Paste_Image.png
Paste_Image.png

畫像標簽一般根據(jù)公司的業(yè)務體系來設計,存儲有HDFS,HBASE,ES
標簽的更新頻率:每日更新,每周、每月更新

Paste_Image.png
Paste_Image.png

用戶畫像的構建原則
  我們做用戶畫像的目的有兩個:
必須從業(yè)務場景出發(fā),解決實際的業(yè)務問題,之所以進行用戶畫像要么是獲取新用戶,或者是提升用戶體驗,或者是挽回流失用戶等有明確的業(yè)務目標 。

根據(jù)用戶畫像的信息做產(chǎn)品設計,必須要清楚知道用戶長什么樣子,有什么行為特征和屬性,這樣才能為用戶設計產(chǎn)品或開展營銷活動。

一般常見的錯誤想法是畫像維度的數(shù)據(jù)越多越好,畫像數(shù)據(jù)越豐富越好,費了很大的力氣進行畫像后,卻發(fā)現(xiàn)只剩下了用戶畫像,和業(yè)務相差甚遠,沒有辦法直接支持業(yè)務運營,投入精力巨大但是回報微小,可以說得不償失。鑒于此,我們的畫像的維度和設計原則都是緊緊跟著業(yè)務需求去推動。
  


  用戶畫像數(shù)據(jù)倉庫建立
  1
  數(shù)據(jù)源的集成

  目前Qunar用戶畫像數(shù)據(jù)倉庫中的數(shù)據(jù)源來自業(yè)務數(shù)據(jù)庫的數(shù)據(jù)和用戶行為日志數(shù)據(jù),目前數(shù)據(jù)倉庫中基本涵蓋了機票、酒店、火車票以及保險等業(yè)務系統(tǒng)的數(shù)據(jù),可以從全方位的了解去哪兒的一個用戶的畫像。
  2
  我們有哪些數(shù)據(jù)?—數(shù)據(jù)維度

  3
  我們有哪些數(shù)據(jù)?—數(shù)據(jù)倉庫
  目前我們畫像數(shù)據(jù)倉庫的構建都是基于Qunar基礎數(shù)據(jù)倉庫進行構建,并按照維度進行劃分。

  目前數(shù)據(jù)倉庫中包括的信息如下:
畫像數(shù)據(jù)倉庫表20個

畫像數(shù)據(jù)倉庫

國內、國際 2年+數(shù)據(jù)

標簽數(shù)據(jù)

每日增量:

- 基本數(shù)據(jù)
  - 業(yè)務數(shù)據(jù)
  - 搜索
  - Booking
  4
  用戶的唯一標志設計
  用戶唯一標識是整個用戶畫像的核心,它把從用戶開始使用app到下單到售后整個所有的用戶行為軌跡進行關聯(lián),可以更好的去跟蹤和描繪一個用戶的特征。


  5
  ETL過程設計:調度系統(tǒng)
依賴數(shù)據(jù)平臺調度系統(tǒng)

定時觸發(fā)和Job依賴觸發(fā)兩種模式


  6
  ETL過程設計:任務執(zhí)行
ETL的過程主要是將數(shù)據(jù)源的清洗到數(shù)據(jù)倉庫表的過程(每天更新增量)

Summary表的處理邏輯(每天更新全量)

標簽庫的處理(每周更新,2年全量)


  7
  用戶主題分析及數(shù)據(jù)挖掘
  有了豐富的畫像數(shù)據(jù)后,產(chǎn)品和運營人員可以根據(jù)用戶主題進行數(shù)據(jù)分析和數(shù)據(jù)挖掘相關的工作。用戶主題Cube的定義如下:
Measure:

– 訂單數(shù)量
  – 訂單金額
  – 搜索次數(shù)
  – Booking次數(shù)
Dimension:

–下單時間
  –出發(fā)時間
  –航司信息
  –艙位信息
  –航班(出發(fā)地、目的地)
  –基本信息(年齡、性別等自然屬性)


  

  用戶畫像標簽構建策略
  1
  用戶標簽特征屬性
  用戶的特征屬性可以是事實的,也可以是抽象的;可以是自然屬性,比如性別,年齡,星座等,可以是社會屬性,比如職業(yè),社交,出生地等;還可以是財富狀況,比如是否高收入人群,是否有豪車豪宅等固定資產(chǎn),對于機票用戶來講位置特征也是比較重要的屬性,比常駐地,常出差地,老家等。這些屬性都可以清楚的描繪一個用戶的畫像特征。

畫像標簽一般根據(jù)公司的業(yè)務體系來設計,存儲有HDFS,HBASE,ES

標簽的更新頻率:每日更新,每周、每月更新

標簽的生命周期:有的數(shù)據(jù)隨時間衰減迭代

2
  用戶標簽分類及特征項
  提到用戶畫像就不得不提到一個詞“標簽”。標簽是表達人的基本屬性、行為傾向、興趣偏好等某一個維度的數(shù)據(jù)標識,它是一種相關性很強的關鍵字,可以簡潔的描述和分類人群。標簽的定義來源于業(yè)務目標,基于不同的行業(yè),不同的應用場景,同樣的標簽名稱可能代表了不同的含義,也決定了不同的模型設計和數(shù)據(jù)處理方式。我們給機票用戶畫像打標簽分類為兩大類,基礎類標簽和個性化標簽,這些標簽可以有重復,但是都是通過不同的角度去定義和刻畫一個用戶,來滿足不同的業(yè)務營銷需求。


  3
  用戶標簽庫構建流程

  

  用戶畫像技術架構
  1
  技術架構

  2
  實施方法論

  

  用戶畫像應用實踐
  1
  用戶群體特征分析
設計目標:

– 根據(jù)條件可選項,輸出篩選用戶群體
  – 圖形展示用戶群體屬性特征
應用場景:

– 如果篩選的用戶群組滿足業(yè)務的要求,將篩選條件形成參數(shù)
  – 根據(jù)參數(shù)提供接口查詢



  2
  客戶行為預測
  客戶行為預測建立步驟:
建模數(shù)據(jù)準備

客戶流失節(jié)點判斷

模型應用變量確定

模型構建

模型應用

模型驗證


  可以對用戶流失做及時預測指導建議用戶維系運營。
  3
  數(shù)據(jù)和業(yè)務在一起
  用戶畫像與業(yè)務產(chǎn)品互相依賴,相輔相成:
用戶畫像標簽庫豐富優(yōu)化

快速提供數(shù)據(jù)服務

數(shù)據(jù)分析+機器學習+模型訓練


  

  總結
  用戶畫像作為大數(shù)據(jù)的根基,它完美的描述了一個用戶的信息全貌,為進一步精準、快速的分析用戶行為、消費等重要信息,用戶畫像倉庫同時也提供了足夠的數(shù)據(jù)基礎。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容