
今天來介紹一篇阿里在WSDM2022上中稿的文章,與之前的用戶興趣建模的論文引入單點(diǎn)用戶行為序列不同,本文引入了頁面級的用戶行為序列,充分建模用戶反饋的上下文信息和頁面興趣演化過程。出發(fā)點(diǎn)較新穎,一起來研究一下。
1、背景
電商場景下,搜索扮演著十分重要的角色。典型的搜索場景如下圖所示,當(dāng)用戶輸入搜索關(guān)鍵詞后,搜索引擎會選擇一堆物品并以翻頁( Search Result Page,簡稱SRP)的形式展現(xiàn)給用戶。每當(dāng)用戶翻到頁面的底端或者重新輸入搜索關(guān)鍵詞,搜索引擎會展示新的SRP。在用戶最終下單前,通常會瀏覽多個(gè)SRP同時(shí)與多個(gè)item產(chǎn)生交互行為。為了達(dá)到更好的推薦效果,建模用戶在這些SRP上的反饋顯得十分重要。

傳統(tǒng)的用戶行為建模,大都建模用戶正向的反饋(只使用點(diǎn)擊或下單序列),如DIN,DIEN。而在DFN(Deep Feedback Network)中,證明了同時(shí)建模用戶正向反饋和負(fù)向反饋能夠取得更好的效果。但是,上述的方法只引入了用戶的單點(diǎn)反饋信息,同時(shí)將用戶的反饋信息拆成單獨(dú)的隊(duì)列,忽略了展現(xiàn)在同一SRP上不同item的相互影響以及其他的上下文信息。
那么為了解決上述所提出的問題,將傳統(tǒng)的單點(diǎn)行為序列建模升級為頁面級用戶行為建模,充分建模用戶反饋的上下文信息。
那么,這種頁面級歷史行為的建模核心是什么呢?論文從兩方面展開:
1)頁面內(nèi)上下文信息建模(Intra-page context information):用戶對item的反饋受相鄰展示的item的影響。建模頁面的上下文信息能夠更好的推測用戶的興趣。一方面,用戶的正向反饋是存在一定噪聲的,舉例來說,如果頁面上展示的大部分是同一品牌的item,那么用戶的點(diǎn)擊行為并不一定能代表用戶對該品牌的偏好。另一方面,用戶通常會對同一頁面上的物品進(jìn)行相互比較,如果頁面上展示了許多不同品牌的item,那么用戶的點(diǎn)擊行為更能反應(yīng)用戶對該品牌的偏好。
2)頁面間用戶興趣演化(Inter-page interest evolution):論文對用戶在不同頁面上的興趣演化做出了一定的假設(shè)。用戶在搜索時(shí)的意圖和興趣可以認(rèn)為是一個(gè)逐漸收斂的過程,用戶在之前頁面中的動態(tài)意圖可以通過后續(xù)頁面中的交互進(jìn)行去噪,因?yàn)楹罄m(xù)頁面中的交互與最終的決策更加相關(guān)。這樣假設(shè)個(gè)人感覺是合理的,用戶在剛進(jìn)入搜索時(shí)可能只知道想買某一類型的商品,如情人節(jié)禮物,但具體買何種禮物不太清楚。隨著不斷的下刷,不斷的對比,用于可能逐漸明確哪種禮物比較適合,意圖逐漸清晰(例子可能不太恰當(dāng),歡迎一體探討)。
為了建模上述兩方面的信息,論文提出了RACP(Recurrent Attention over Contextualized Page se- quence),通過一種層級結(jié)構(gòu)建模用戶的頁面級行為反饋。下一節(jié)對具體的細(xì)節(jié)進(jìn)行介紹。
2、RACP介紹
2.1 整體介紹
如下圖所示,RACP的主要結(jié)構(gòu)從下到上主要包含四部分:Embedding Layer, Intra-page Context-aware Interest Layer, Inter-page Interest Backtracking Layer和Page-level Interest Aggregation Layer。接下來對這幾部分進(jìn)行分別介紹。

2.2 Embedding Layer
模型的輸入包含以下幾方面:
目標(biāo)item特征:item特征包括item id,品類id,品牌id,店鋪id和一些統(tǒng)計(jì)特征(點(diǎn)擊數(shù)和下單數(shù))等等
用戶特征和Query特征:用戶畫像特征包括年齡,性別,購買力等級等。Query特征包含query id,query字符串,分詞信息以及預(yù)測的query對應(yīng)的品類id等特征。
用戶頁面級歷史行為SRPs:用戶的頁面級歷史行為序列并非只包含帶有正反饋的頁面序列,如果一個(gè)頁面沒有用戶的反饋,也同樣會包含在歷史行為中。每一個(gè)SRP包含展示的item列表信息,頁面對應(yīng)的query特征等。
這里要注意一點(diǎn)是,用戶的頁面級行為序列經(jīng)過特殊處理,即對應(yīng)頁面的query要和當(dāng)次搜索的query的品類需要相同,從而避免無關(guān)的搜索行為對預(yù)測產(chǎn)生影響,這相當(dāng)于SIM中的Hard-Search的方法對歷史行為進(jìn)行過濾。
2.3 Intra-page Context-aware Interest Layer
Intra-page Context-aware Interest Layer主要建模頁面內(nèi)的信息,引入了頁面粒度的attention機(jī)制。計(jì)算過程如下:


pi是最終的頁面信息表示,那么公式中的其他符號代表的含義是什么呢?Qi代表的是用戶當(dāng)前頁面的意圖表示,具體的計(jì)算過程在下一節(jié)介紹。xi,j代表頁面中第j個(gè)item的特征,fi,j代表用戶對頁面中第j個(gè)item的反饋特征(點(diǎn)擊與否),ci,j代表頁面中第j個(gè)item對應(yīng)的上下文信息,論文中給出了5個(gè)方面的上下文信息:1)query以及query對應(yīng)的品類,2)頁面中與第j個(gè)item相同品類的item的個(gè)數(shù),3)頁面中與第j個(gè)item相同品牌的item的個(gè)數(shù),4)頁面中與第j個(gè)item相同賣家的item的個(gè)數(shù),5)第j個(gè)item在價(jià)格,展示位置,銷量等信息上的相對排序。
2.4 Inter-page Interest Backtracking Layer
Inter-page Interest Backtracking Layer主要建模用戶的興趣演進(jìn)過程,這里比較有意思的點(diǎn)是,與DIEN建模用戶興趣演化不同,這里采用的是興趣回溯的方式,即從用戶的最后一個(gè)頁面信息,對用戶在每個(gè)頁面上的興趣進(jìn)行回溯(Backtracking)。這里采用GRU結(jié)構(gòu),計(jì)算過程如下:

這里使用GRU同時(shí)采用回溯的方式,基于我們前文所介紹的假設(shè),即認(rèn)為用戶的興趣在搜索過程中是一個(gè)不斷收斂的過程,使用用戶在后續(xù)頁面的交互行為可以推測用戶在前面頁面的興趣。上面公式中的符號這里稍作解釋,Qt代表用戶第t個(gè)頁面歷史行為對應(yīng)的意圖表示,通過GRU計(jì)算得到,初始的興趣表示QT為用戶特征,當(dāng)前搜索特征以及target item特征的拼接,為用戶當(dāng)前的意圖表示。pt為第t個(gè)頁面歷史行為的頁面向量。
這里個(gè)人感覺公式有些混亂,pt應(yīng)該改為pt+1是更加合理的。
2.5 Page-level Interest Aggregation Layer
經(jīng)過上面的介紹可以看出,每個(gè)頁面的表示是通過Intra和Inter兩個(gè)模塊共同得到的,接下來就是類似于DIN的過程,與當(dāng)前用戶意圖更相近的頁面信息能夠?qū)︻A(yù)測產(chǎn)生更大的影響。計(jì)算公式如下:

2.6 模型訓(xùn)練
最后,用戶特征u,query向量qT,目標(biāo)item特征xt和加權(quán)頁面行為表示s進(jìn)行拼接,輸入到MLP層得到點(diǎn)擊率預(yù)估值,并使用logloss進(jìn)行訓(xùn)練:

3、實(shí)驗(yàn)結(jié)果
論文將RACP與許多經(jīng)典的Baseline方法在兩個(gè)數(shù)據(jù)集上進(jìn)行了對比,均取得了一定程度的提升:

4、總結(jié)
在用戶行為建模逐漸進(jìn)入深水區(qū)的情況下,論文創(chuàng)新性的引入了頁面級的歷史行為序列,充分考慮頁面中item的相互影響以及頁面興趣的演化過程,具有一定的借鑒意義。不過個(gè)人認(rèn)為還是存在一些值得考慮的問題,首先,CTR預(yù)估為單點(diǎn)興趣預(yù)估,無法獲取到同一頁面中相鄰展示的item信息,那么使用頁面向量與單一item向量做attention的方式是否合理?這種頁面興趣反饋是否更加適用于重排等階段?其次,即使對頁面行為限定在同一品類的搜索詞下,將用戶興趣回溯運(yùn)用在不同的搜索過程中是否合理?是否可以考慮類似DSIN的方式,用戶意圖在同次搜索下進(jìn)行回溯?以上是我個(gè)人的一些想法,可能存在不合理的地方,歡迎大家一起交流想法!