Feed流算法初探

什么是Feed?

Feed是一個(gè)互聯(lián)網(wǎng)早起概念,本意是RSS中用來(lái)接收信息來(lái)源更新的接口。普遍對(duì)feed的解釋是:

a web feed (or news feed) is a?data format?used for providing users with?frequently updated content. Content distributors?syndicate?a web feed, thereby allowing users to?subscribe?to it

即feed實(shí)際上是一種數(shù)據(jù)格式,給用戶持續(xù)提供更新的內(nèi)容。我們刷微博、朋友圈、知乎、各大門戶媒體,我們所看到的內(nèi)容,都是一種feed流,我們獲取的內(nèi)容好不夸張的說(shuō),是被這些feed流所控制了。內(nèi)容分發(fā)機(jī)制能夠控制用戶在合適的時(shí)間看到“規(guī)定”的內(nèi)容。

早期的feed流是以時(shí)間線來(lái)控制的,即timeline,新浪微博早期就是以timeline的形式進(jìn)行內(nèi)容展示的。如今feed流進(jìn)行了多種變革,不再是單純的timeline,各大互聯(lián)網(wǎng)公司都有自己的內(nèi)容分發(fā)機(jī)制。

如同搜索一樣,內(nèi)容分發(fā)機(jī)制的設(shè)計(jì)也始終關(guān)注兩大核心問(wèn)題:

1.給用戶分發(fā)(展示)哪些內(nèi)容

2.對(duì)分發(fā)的內(nèi)容怎么進(jìn)行排序

不同的內(nèi)容分發(fā)機(jī)制其實(shí)對(duì)這兩個(gè)問(wèn)題所給出的解決方式是不一樣的。不同的互聯(lián)網(wǎng)公司為了自己的商業(yè)利益或者其他戰(zhàn)略層面的考慮,所設(shè)計(jì)的feed流設(shè)計(jì)方案也是不同。

(1)永恒的Timeline

Timeline是Feed流設(shè)計(jì)中最原始、最基本也是最直覺(jué)的展示形式。timeline,所謂的“時(shí)間線”,內(nèi)容的分發(fā)完全按照時(shí)間進(jìn)行排序和展示的。比如說(shuō)早期的微博,用戶關(guān)注(訂閱)了一些“大V”,在微博首頁(yè)看到的內(nèi)容按照所關(guān)注的人所發(fā)微博的時(shí)間順序進(jìn)行展示的。再比如現(xiàn)在的微信朋友圈,也是按照朋友發(fā)布內(nèi)容的時(shí)間順序進(jìn)行展示的。

其實(shí)微信朋友圈、早期的微博很好的回答了feed流設(shè)計(jì)兩大核心問(wèn)題:

1.給用戶分發(fā)(展示)哪些內(nèi)容:微博是關(guān)注的用戶、微信是相互專注的好友

2.對(duì)分發(fā)的內(nèi)容怎么進(jìn)行排序:按照時(shí)間的先后順序,最新的內(nèi)容越靠前

Timeline有簡(jiǎn)單粗暴的優(yōu)點(diǎn):利于用戶對(duì)呈現(xiàn)的內(nèi)容進(jìn)行理解,時(shí)間的先后順序嘛,另外由于是按照時(shí)間順序,每次更新都能最大化的保證用戶能夠看到更新的內(nèi)容。當(dāng)時(shí)timeline也有致命的弱點(diǎn):內(nèi)容呈現(xiàn)的效率極為底下,甚至可能會(huì)出現(xiàn)大量的垃圾內(nèi)容。需要內(nèi)容提供方十分克制,也需要用戶對(duì)這些內(nèi)容足夠關(guān)注??梢韵胂笠幌?,一個(gè)平臺(tái)每天發(fā)布上千條內(nèi)容,如果按照timeline的內(nèi)容分發(fā)機(jī)制,這么多信息一下子給用戶展示,必定給用戶造成了嚴(yán)重的干擾?,F(xiàn)在的新浪微博就放棄了timeline這種feed流設(shè)計(jì),這里不去探討微博為什么放棄timeline,可以肯定的是timeline這種內(nèi)容分發(fā)機(jī)制日益不能滿足用戶的需求。(ps:實(shí)際上,很多用戶也開(kāi)始懷念ttimeline,如今的微博內(nèi)容分發(fā)機(jī)制也引起了用戶大量吐槽)

(2)重力排序法——兼顧熱度和更新時(shí)間

其實(shí)一個(gè)平臺(tái)大了之后,每天將會(huì)產(chǎn)生大量的內(nèi)容,既有大量的feed流,這些feed流中大部分內(nèi)容其實(shí)對(duì)用戶是沒(méi)有太大的價(jià)值的。這種場(chǎng)景其實(shí)是很常見(jiàn)的。微信朋友圈之所以現(xiàn)在還保持timeline的內(nèi)容分發(fā)機(jī)制,是因?yàn)榕笥讶γ刻飚a(chǎn)生的feed其實(shí)不多,使用timeline對(duì)微信用戶會(huì)更加友好。但微博、知乎、今日頭條不一樣,每天產(chǎn)生的feed流比微信朋友圈大得多,遇到這種棘手的問(wèn)題該如何解決也是考驗(yàn)產(chǎn)品經(jīng)理的能力。

何為重力排序法,對(duì)于一個(gè)feed流中的內(nèi)容而言,有兩種力量:重力和拉力。重力就是讓內(nèi)容持續(xù)往下路的力,即時(shí)間,時(shí)間越久,掉的越快;拉力就是讓內(nèi)容往前排的力,比如知乎的點(diǎn)贊、門戶新聞的閱讀數(shù)等。重力和拉力,兩者相斥,共同決定內(nèi)容的排序機(jī)制。

這里有一個(gè)重力算法的排序公式,來(lái)自于Reddit的核心排序算法:

score(H,T)=logH + (T-t)/A

這個(gè)公式里面有一些因子,代表如下含義。H表示內(nèi)容的熱度,比如內(nèi)容的瀏覽量、點(diǎn)贊數(shù),也可以是經(jīng)過(guò)加權(quán)(降權(quán))處理過(guò)的一些值,H的值越大,排名自然靠前;T表示內(nèi)容的發(fā)布時(shí)間;t表示一個(gè)時(shí)間的起始值,只要比發(fā)布的時(shí)間早就成。T-t用來(lái)衡量一個(gè)內(nèi)容的的新舊程度,T-t的值越大,表示內(nèi)容越新;A表示一個(gè)系數(shù),A越大,T-t的影響力就越小,即按照時(shí)間進(jìn)行排序的影響就越小,內(nèi)容更新的速度也越慢。一般來(lái)說(shuō),A的初始值為10個(gè)小時(shí),36000秒,后面不斷迭代調(diào)整參數(shù)。

(3)智能排序法——在唾罵中前行

對(duì)于智能排序的算法,由于牽涉到復(fù)雜的模型構(gòu)建和機(jī)器學(xué)習(xí),已超出了我的能力范圍,這里只是簡(jiǎn)單的闡述一下智能排序的機(jī)制,比較通俗的講解可以參考“純銀”的一篇文章,淺顯易懂。(http://m.itdecent.cn/p/4b51126fe930)

什么是智能排序?

首先,系統(tǒng)需要知道什么是一個(gè)內(nèi)容被展示的目標(biāo)值。比如微博,一個(gè)內(nèi)容被展示的目標(biāo)值是轉(zhuǎn)發(fā)、評(píng)論、點(diǎn)贊的次數(shù)。那么通過(guò)大量的樣本機(jī)器學(xué)習(xí),系統(tǒng)對(duì)于什么是好的內(nèi)容會(huì)有一個(gè)預(yù)測(cè)。這對(duì)于一個(gè)內(nèi)容的預(yù)測(cè),則是智能排序的基礎(chǔ)。

其次,系統(tǒng)會(huì)屏蔽一些違規(guī)的內(nèi)容,比如涉及到政治、敏感事件

再次,為了用戶內(nèi)容質(zhì)量,系統(tǒng)會(huì)在用戶的feed中增加一些熱門的內(nèi)容

最后,考慮內(nèi)容和用戶的親密度,系統(tǒng)認(rèn)為內(nèi)容受到歡迎的程度,內(nèi)容事件衰減等因素后,系統(tǒng)進(jìn)行綜合排序。

智能排序聽(tīng)起來(lái)是個(gè)很好的主意。但是也是一把雙刃劍,從微博的排序法被罵可以看出,也有很大一部分用戶其實(shí)不滿這個(gè)智能排序法。但為什么微博要一意孤行呢?也許是商業(yè)利益、也許是戰(zhàn)略,這里不去探究里面的動(dòng)機(jī),畢竟好多探究是經(jīng)不起推敲的,只是一本正經(jīng)的胡扯。

就像文章開(kāi)頭所提出的兩個(gè)核心問(wèn)題:1.給用戶分發(fā)(展示)哪些內(nèi)容;2.對(duì)分發(fā)的內(nèi)容怎么進(jìn)行排序。我們?cè)谠O(shè)計(jì)內(nèi)容分發(fā)機(jī)制的時(shí)候,不管選擇何種機(jī)制,作為產(chǎn)品經(jīng)理,需要根據(jù)用戶實(shí)際的場(chǎng)景來(lái)進(jìn)行feed流的設(shè)計(jì)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容