推薦算法——隱語(yǔ)義模型

LFM(latent factor model)?

通過(guò)隱含特征聯(lián)系用戶(hù)興趣和物品。?

計(jì)算用戶(hù)u對(duì)物品i的興趣:?

preference(u,i)=rui=pTuqi=∑f=1Fpu,kqi,k

其中pu,k度量了用戶(hù)u的興趣和隱類(lèi)k之間的關(guān)系,qi,k度量了隱類(lèi)k和物品I之間的關(guān)系。

如何計(jì)算兩個(gè)參數(shù)?需要訓(xùn)練集,對(duì)每個(gè)用戶(hù)u,訓(xùn)練集包含用戶(hù)u喜歡的和不感興趣的物品,通過(guò)學(xué)習(xí)這個(gè)數(shù)據(jù)集,得到模型參數(shù)。我們知道推薦系統(tǒng)中用戶(hù)的行為分為顯性反饋和隱性反饋,LFM在顯性反饋(評(píng)分?jǐn)?shù)據(jù))上解決評(píng)分預(yù)測(cè)可以有很好的精度,但是對(duì)于隱性反饋(只有喜歡什么,沒(méi)有不喜歡什么),在隱性反饋中需要為用戶(hù)生成負(fù)樣本,Rong Pan 在其文章中對(duì)負(fù)樣本的生成做了討論:

1、對(duì)于一個(gè)用戶(hù),他沒(méi)有過(guò)行為的物品作為負(fù)樣本

2、從他沒(méi)有行為的物品均勻采樣出一些物品作為負(fù)樣本

3、從沒(méi)有行為的物品中采樣,但是采樣時(shí)保證用戶(hù)的正負(fù)樣本數(shù)目相當(dāng)

4、從沒(méi)有行為的物品中采樣,偏重不熱門(mén)的物品。?

Rong Pan 在論文中提出1負(fù)樣本太多,計(jì)算復(fù)雜度高且精度差,3好于2,2好于4。

后來(lái)在11年的KDD Cup 推薦系統(tǒng)比賽中,發(fā)現(xiàn)應(yīng)該遵循如下原則:

1、每個(gè)用戶(hù)保證正負(fù)樣本的均衡

2、采樣負(fù)樣本時(shí)選取很熱門(mén)但是用戶(hù)沒(méi)有行為的物品

當(dāng)采樣出負(fù)樣本之后,得到用戶(hù)-物品集K={(u,i)},正樣本r=1,負(fù)樣本r=0.?

損失函數(shù)為:?

C=∑(u,i)∈K(rui?r^ui)2=∑(u,i)∈K(rui?∑k=1Kpu,kqi,k)2+λ||pu||2+λ||qi||2

其中λ||pu||2+λ||qi||2是防止過(guò)擬合的正則化項(xiàng)。利用諸如隨記梯度下降法等算法優(yōu)化損失。?

基于LFM實(shí)際系統(tǒng)的例子?

雅虎的研究人員公布過(guò)一個(gè)使用LFM進(jìn)行首頁(yè)個(gè)性化設(shè)計(jì)的方案方案連接?

雅虎以CTR(點(diǎn)擊通過(guò)率)作為優(yōu)化的目標(biāo),利用LFM預(yù)測(cè)用戶(hù)是否會(huì)點(diǎn)擊一個(gè)連接。但是LFM難以實(shí)現(xiàn)實(shí)時(shí)的推薦,經(jīng)典的LFM每次掃描所有的用戶(hù),計(jì)算隱向量pu, 耗時(shí),冷啟動(dòng)問(wèn)題非常明顯,雅虎的技術(shù)人員提出了一個(gè)解決方案,利用新聞鏈接的內(nèi)容屬性(關(guān)鍵詞,類(lèi)別等)得到鏈接i的內(nèi)容特征向量yi, 實(shí)時(shí)收集用戶(hù)對(duì)鏈接的行為,利用這些數(shù)據(jù)得到鏈接i的隱特征qi,利用如下公式判斷用戶(hù)u是否會(huì)點(diǎn)擊鏈接i?

rui=xTu.yi+pTu.qi

yi是根據(jù)鏈接內(nèi)容直接生成,xu是根據(jù)歷史記錄獲得的,每天計(jì)算一次即可。pu、qi是利用用戶(hù)近幾個(gè)小時(shí)的行為訓(xùn)練LFM獲得的。


轉(zhuǎn)載自:http://blog.csdn.net/u011060119/article/details/75632533

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容