基于K-means給客戶分群
一、背景描述
1、我們的想要將客戶進(jìn)行分類,分類后是為了對不同的客戶進(jìn)行分類管理,給與不同的營銷資源于不同的客戶,實(shí)現(xiàn)企業(yè)利潤最大化。
二、本次目標(biāo)
- 使用任意聚類算法實(shí)現(xiàn)將用戶分類
- 對比不同用戶的客戶價(jià)值、并制定不同的營銷策略
- 將分類數(shù)據(jù)整理為可展示的數(shù)據(jù)結(jié)構(gòu),做可視化展現(xiàn),并可導(dǎo)出相關(guān)用戶
三、分析思路
計(jì)劃使用經(jīng)典的RFM模型進(jìn)行分層,如果使用幾十個(gè)特征去做聚類會有不能解釋的情況,但不同的是我們會針對電商的場景使用額外2個(gè)維度
最大消費(fèi)金額、高優(yōu)惠訂單占比,用來體現(xiàn)這個(gè)客戶的單次消費(fèi)能力和優(yōu)惠敏感程度。
執(zhí)行步驟
- 數(shù)據(jù)清洗和特征工程
- 結(jié)論輸出
- 未來優(yōu)化思路
根據(jù)結(jié)果進(jìn)行分析
分群
- 消費(fèi)金額:用戶消費(fèi)金額,越大代表消費(fèi)越高
- 消費(fèi)訂單數(shù):用戶下單數(shù),越高代表下單越多
- 最近一次距今支付日期:最近一次距今下單天數(shù),越大代表越久沒下單
- 最大支付訂單金額:周期內(nèi)最大的一次訂單金額,越大說明最大下單金額越高
- 平均訂單優(yōu)惠金額:平均每單的優(yōu)惠金額,越大代表用戶越是對優(yōu)惠越敏感
- 群體0(潛力用戶):消費(fèi)能力一般,對優(yōu)惠敏感度高,購買周期較長
- 群體1(VIP用戶):消費(fèi)能夠力最強(qiáng),對優(yōu)惠最不敏感,購買周期最短
- 群體2(薅羊毛用戶):低消費(fèi)能力,最高的優(yōu)惠敏感度,相當(dāng)于有優(yōu)惠才買沒優(yōu)惠就不買
- 群體3(一般用戶):消費(fèi)能力較高,人數(shù)也最多,對優(yōu)惠屬于正常響應(yīng)度(有沒有都會買)
結(jié)論

- 對VIP用戶,這類客戶消費(fèi)能力最強(qiáng),對優(yōu)惠完全不敏感,公司應(yīng)優(yōu)先將資源投放到他們身上,維持這類用戶的忠誠度
- 對一般用戶,消費(fèi)金額和消費(fèi)頻率較為穩(wěn)定,沒有過高過低的情況,對這類用戶可以嘗試刺激提高下單頻率。
- 對薅羊毛用戶,要進(jìn)行風(fēng)險(xiǎn)防控,這類用戶不多,但是一旦出現(xiàn)損失較大。
- 對潛力用戶,優(yōu)惠敏感度較高,購買頻率不高,可以在需要提升下單人數(shù)時(shí),單獨(dú)對這個(gè)群體進(jìn)行優(yōu)惠活動刺激。
后續(xù)可優(yōu)化點(diǎn)
- 發(fā)現(xiàn)消費(fèi)金額和消費(fèi)訂單數(shù)較為相似,可以合并這兩維度,作為用戶消費(fèi)能力維度。
- 多個(gè)群體,像薅羊毛用戶分布不均
- 可以嘗試用多個(gè)聚類算法去測試效果
步驟
PS:jupyter notebook轉(zhuǎn)MD格式很有問題,HTML代碼都帶出來了,而且不能正確顯示,只好截個(gè)圖了。

_C__Users_Ryan_Downloads_%E8%81%9A%E7%B1%BB%E7%AE%97%E6%B3%95%E7%BB%99%E5%AE%A2%E6%88%B7%E5%88%86%E7%BE%A4.html (1).png