一、推薦系統(tǒng)
二、阿里云智能推薦AIRec
三、用戶畫像介紹
1、用戶畫像的概念
????用戶畫像是指根據(jù)用戶的屬性、偏好、生活習(xí)慣、行為等信息,抽象出來的標(biāo)簽化用戶模型。
? ??標(biāo)簽是通過對用戶信息分析而來的高度精煉的特征標(biāo)識。
????通過打標(biāo)簽可以利用一些高度概括、容易理解的特征來描述用戶,可以讓人更容易理解用戶,并且可以方便計算機(jī)處理。

用戶畫像是對現(xiàn)實世界中用戶的建模,用戶畫像包含目標(biāo),方式,組織,標(biāo)準(zhǔn),驗證這5個方面。
??目標(biāo):指的是描述人,認(rèn)識人,了解人,理解人。
??方式:分為非形式化手段,如使用文字、語言、圖像、視頻等方式描述人;形式化手段,即使用數(shù)據(jù)的方式來刻畫人物的畫像。
??組織:指的是結(jié)構(gòu)化、非結(jié)構(gòu)化的組織形式。
??標(biāo)準(zhǔn):指的是使用常識、共識、知識體系的漸進(jìn)過程來刻畫人物,認(rèn)識了解用戶。
??驗證:依據(jù)側(cè)重說明了用戶畫像應(yīng)該來源事實、經(jīng)得起推理和檢驗。

2、用戶畫像的作用
(1)精準(zhǔn)營銷:根據(jù)歷史用戶特征,分析產(chǎn)品的潛在用戶和用戶的潛在需求,針對特定群體,利用短信、郵件等方式進(jìn)行營銷。
(2)用戶統(tǒng)計:根據(jù)用戶的屬性、行為特征對用戶進(jìn)行分類后,統(tǒng)計不同特征下的用戶數(shù)量、分布;分析不同用戶畫像群體的分布特征。
(3)數(shù)據(jù)挖掘:以用戶畫像為基礎(chǔ)構(gòu)建推薦系統(tǒng)、搜索引擎、廣告投放系統(tǒng),提升服務(wù)精準(zhǔn)度。
(4)服務(wù)產(chǎn)品:對產(chǎn)品進(jìn)行用戶畫像,對產(chǎn)品進(jìn)行受眾分析,更透徹地理解用戶使用產(chǎn)品的心理動機(jī)和行為習(xí)慣,完善產(chǎn)品運(yùn)營,提升服務(wù)質(zhì)量。
(5)行業(yè)報告&用戶研究:通過用戶畫像分析可以了解行業(yè)動態(tài),比如人群消費習(xí)慣、消費偏好分析、不同地域品類消費差異分析


3、用戶畫像的分類
畫像方法

從應(yīng)用角度來看,可以分為行為畫像、健康畫像、企業(yè)信用畫像、個人信用畫像、靜態(tài)產(chǎn)品畫像、旋轉(zhuǎn)設(shè)備畫像、社會畫像和經(jīng)濟(jì)畫像等。
4、用戶畫像需要用到哪些數(shù)據(jù)
(1)人口屬性:包括性別、年齡等人的基本信息
(2)興趣特征:瀏覽內(nèi)容、收藏內(nèi)容、閱讀咨詢、購買物品偏好等
(3)消費特征:與消費相關(guān)的特征
(4)位置特征:用戶所處城市、所處居住區(qū)域、用戶移動軌跡等
(5)設(shè)備屬性:使用的終端特征等
(6)行為數(shù)據(jù):訪問時間、瀏覽路徑等用戶在網(wǎng)站的行為日志數(shù)據(jù)
(7)社交數(shù)據(jù):用戶社交相關(guān)數(shù)據(jù)
去哪兒網(wǎng)案例:


5、用戶畫像的主要應(yīng)用場景
a)用戶屬性
b)用戶標(biāo)簽畫像
c)用戶偏好畫像
d)用戶流失
e)用戶行為
f)產(chǎn)品設(shè)計
g)?個性化推薦、廣告系統(tǒng)、活動營銷、內(nèi)容推薦、興趣偏好
6、用戶畫像標(biāo)簽體系的建立
6.1 標(biāo)簽體系

(1)標(biāo)簽分類

(2)標(biāo)簽級別
運(yùn)算層級
??事實標(biāo)簽:是通過對于原始數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行統(tǒng)計分析而來的,比如用戶投訴次數(shù),是基于用戶一段時間內(nèi)實際投訴的行為做的統(tǒng)計。
??模型標(biāo)簽:模型標(biāo)簽是以事實標(biāo)簽為基礎(chǔ),通過構(gòu)建事實標(biāo)簽與業(yè)務(wù)問題之間的模型,進(jìn)行模型分析得到。比如,結(jié)合用戶實際投訴次數(shù)、用戶購買品類、用戶支付的金額等,進(jìn)行用戶投訴傾向類型的識別,方便客服進(jìn)行分類處理。
??預(yù)測標(biāo)簽:則是在模型的基礎(chǔ)上做預(yù)測,比如針對投訴傾向類型結(jié)構(gòu)的變化,預(yù)測平臺輿情風(fēng)險指數(shù)。

(3)標(biāo)簽命名&賦值

(4)標(biāo)簽屬性
標(biāo)簽屬性可以理解為針對標(biāo)簽進(jìn)行的再標(biāo)注,這一環(huán)節(jié)的工作主要目的是幫助內(nèi)部理解標(biāo)簽賦值的來源,進(jìn)而理解指標(biāo)的含義。
1、固有屬性:是指這些指標(biāo)的賦值體現(xiàn)的是用戶生而有之或者事實存在的,不以外界條件或者自身認(rèn)知的改變而改變的屬性。比如:性別、年齡、是否生育等。
2、推導(dǎo)屬性:由其他屬性推導(dǎo)而來的屬性,比如星座,我們可以通過用戶的生日推導(dǎo),比如用戶的品類偏好,則可以通過日常購買來推導(dǎo)。
3、行為屬性:產(chǎn)品內(nèi)外實際發(fā)生的行為被記錄后形成的賦值,比如用戶的登陸時間,頁面停留時長等。
4、態(tài)度屬性:用戶自我表達(dá)的態(tài)度和意愿。比如說我們通過一份問卷向用戶詢問一些問題,并形成標(biāo)簽,如詢問用戶:是否愿意結(jié)婚,是否喜歡某個品牌等。當(dāng)然在大數(shù)據(jù)的需求背景下,利用問卷收集用戶標(biāo)簽的方法效率顯得過低,更多的是利用產(chǎn)品中相關(guān)的模塊做了用戶態(tài)度信息收集。
5、測試屬性:測試屬性是指來自用戶的態(tài)度表達(dá),但并不是用戶直接表達(dá)的內(nèi)容,而是通過分析用戶的表達(dá),結(jié)構(gòu)化處理后,得出的測試結(jié)論。比如,用戶填答了一系列的態(tài)度問卷,推導(dǎo)出用戶的價值觀類型等。

6.2 標(biāo)簽體系結(jié)構(gòu)分類
(1)結(jié)構(gòu)化標(biāo)簽體系
簡單地說,就是標(biāo)簽組織成比較規(guī)整的樹或森林,有明確的層級劃分和父子關(guān)系。
(2)非結(jié)構(gòu)化標(biāo)簽體系
非結(jié)構(gòu)化,就是各個標(biāo)簽就事論事,各自反應(yīng)各自的用戶興趣,彼此之間并無層級關(guān)系,也很難組織成規(guī)整的樹狀結(jié)構(gòu)。非結(jié)構(gòu)化標(biāo)簽的典型例子,是搜索廣告里用的關(guān)鍵詞。還有Facebook用的用戶興趣詞。
(3)半結(jié)構(gòu)化標(biāo)簽體系
在用于效果廣告時,標(biāo)簽設(shè)計的靈活性大大提高了。標(biāo)簽體系是不是規(guī)整,就不那么重要了,只要有效果就行。在這種思路下,用戶標(biāo)簽往往是在行業(yè)上呈現(xiàn)出一定的并列體系,而各行業(yè)內(nèi)的標(biāo)簽設(shè)計則以“逮住老鼠就是好貓”為最高指導(dǎo)原則,切不可拘泥于形式。
6.3?用戶畫像標(biāo)簽層級的建模方法
用戶畫像的核心是標(biāo)簽的建立,用戶畫像標(biāo)簽建立的各個階段使用的模型和算法如下圖所示。

原始數(shù)據(jù)層。對原始數(shù)據(jù),我們主要使用文本挖掘的算法進(jìn)行分析如常見的TF-IDF、TopicModel主題模型、LDA 等算法,主要是對原始數(shù)據(jù)的預(yù)處理和清洗,對用戶數(shù)據(jù)的匹配和標(biāo)識。
事實標(biāo)簽層。通過文本挖掘的方法,我們從數(shù)據(jù)中盡可能多的提取事實數(shù)據(jù)信息,如人口屬性信息,用戶行為信息,消費信息等。其主要使用的算法是分類和聚類。分類主要用于預(yù)測新用戶,信息不全的用戶的信息,對用戶進(jìn)行預(yù)測分類。聚類主要用于分析挖掘出具有相同特征的群體信息,進(jìn)行受眾細(xì)分,市場細(xì)分。對于文本的特征數(shù)據(jù),其主要使用相似度計算,如余弦夾角,歐式距離等。模型標(biāo)簽層。使用機(jī)器學(xué)習(xí)的方法,結(jié)合推薦算法。
模型標(biāo)簽層。完成對用戶的標(biāo)簽建模與用戶標(biāo)識。其主要可以采用的算法有回歸,決策樹,支持向量機(jī)等。通過建模分析,我們可以進(jìn)一步挖掘出用戶的群體特征和個性權(quán)重特征,從而完善用戶的價值衡量,服務(wù)滿意度衡量等。預(yù)測層。也是標(biāo)簽體系中的營銷模型
預(yù)測層。這一層級利用預(yù)測算法,如機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí),計量經(jīng)濟(jì)學(xué)中的回歸預(yù)測,數(shù)學(xué)中的線性規(guī)劃等方法。實習(xí)對用戶的流失預(yù)測,忠實度預(yù)測,興趣程度預(yù)測等等,從而實現(xiàn)精準(zhǔn)營銷,個性化和定制化服務(wù)。
不同的標(biāo)簽層級會考慮使用對其適用的建模方法,對一些具體的問題,有專門的文章對其進(jìn)行研究。
7、用戶畫像的基本步驟
(1)用戶畫像的基本方向
(2)用戶數(shù)據(jù)收集
(3)用戶標(biāo)簽建模

另外,需要注意的是用戶畫像的時效性,構(gòu)建畫像的數(shù)據(jù)多為歷史數(shù)據(jù),但用戶的行為、偏好等特征多會隨著時間的推移而發(fā)生變化。
8、用戶畫像的驗證

9、用戶畫像平臺&架構(gòu)
