DIN, KDD18, 阿里媽媽基于attention建模用戶行為序列

Deep Interest Network for Click-Through Rate Prediction

1. Motivation

本文是阿里媽媽發(fā)表在KDD18上的論文,最主要的貢獻表現(xiàn)在對于用戶的輸入行為序列與當前要打分的target item之前進行attention操作,對輸入行為序列進行加權(quán)求和得到user的個性化的向量表示。

Motivation就是作者注意到用固定的embedding來表示user,在面對不同的打分item時不夠靈活,表達能力不足;從而基于與attention類似的方式(與attention不完全相似,主體思想類似)學習user與item之間的顯式交互。

2. DIN

din.jpg

2.1 Attention

看上去很直接,現(xiàn)在基于attention建模用戶行為序列也稱為標配了。與傳統(tǒng)的attention不完全一致,輸出的時候不用softmax對所有item的權(quán)重歸一化。

2.2 Mini-batch Aware Regularization

作者認為傳統(tǒng)的L1或者L2正則化需要對全局的參數(shù)計算,可能涉及到參數(shù)量過大。

W \in \mathbb{R}^{D \times K}是embeding table, K是embedding的維度。作用于W的L2正則表示為,

L_2(W) = ||W||_2^2 = \sum_{j=1}^K ||w_j||_2^2 = \sum_{(x, y) \in S}\sum_{j=1}^K \frac{I(x_j \ne 0)}{n_j}||w_j||_2^2

Mini-batch L2正則表示為,

L_2(W) = \sum_{j=1}^K \sum_{m=1}^B \sum_{(x, y)\in B_m} \frac{I(x_j \ne 0)}{n_j}||w_j||_2^2

B_m代表第m個mini-batch,n_j表示feature id j在全體樣本中出現(xiàn)的次數(shù)。只對每個mini-batch中出現(xiàn)(非零)的參數(shù)做正則化。

這屬于對于大規(guī)模embedding table的正則化工程層面的優(yōu)化實現(xiàn)。

2.3 Data Adaptive Activation Function

PReLU是,

f(s) = p(s) s + (1 - p(s)) \alpha s

p(s) = I(s > 0)是一個示性函數(shù)。

作者認為PReLU不能適應每一個layer的輸入的分布不同的情形,從而提出了Dice的激活函數(shù),

f(s) = p(s) s + (1 - p(s) \alpha s,

p(s) = \frac{1}{1 + e ^{-\frac{s-E(s)}{\sqrt{Var(s) + \epsilon}}} }

本質(zhì)上對每一個輸入都維護類似Batch LayerNormalization一樣需要記錄的均值與方差,在激活之前進行標準化。

3. Experiment

din_result.jpg

優(yōu)點:
(1)
現(xiàn)在對于用戶行為序列做attention或者self-attention已經(jīng)成為標配了,阿里媽媽團隊確實思考與行動非常超前。

思考:
(1)對于冷啟動item,或者用戶行為序列里并沒有的興趣、臨時可能迸發(fā)出來的興趣,除了探索(exploitaion),還有沒有更高效的方法?

4. References

[1] Zhou, Guorui, et al. "Deep interest network for click-through rate prediction." Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容