現(xiàn)在任何只要關(guān)聯(lián)抖音系列的文案,都會(huì)涉及到算法機(jī)制的話題。但是對(duì)于新手來(lái)說(shuō)像極了“無(wú)字天書”只能給有緣人觀看,信息碎片不完整??赐暧钟幸环N似懂非懂的感覺(jué),實(shí)操卻還是拋在一邊。今天這篇文章會(huì)由淺到深的介紹整個(gè)算法機(jī)制。過(guò)濾掉無(wú)用的信息,只展現(xiàn)與視頻制作強(qiáng)關(guān)系的內(nèi)容,滿滿干貨請(qǐng)耐心閱讀。
算法機(jī)制初體驗(yàn)
什么是算法機(jī)制
算法機(jī)制好比“植物生長(zhǎng)規(guī)律”,你可以通過(guò)"改造種子,肥料,種植環(huán)境"等外來(lái)因素去影響他的生產(chǎn)結(jié)果,比如縮短生長(zhǎng)周期,量產(chǎn)等。但是卻改變不了他生長(zhǎng)環(huán)節(jié),種子→萌發(fā)→結(jié)果環(huán)節(jié)還是一樣一環(huán)不能少。
為什么了解算法機(jī)制
那么我們學(xué)習(xí)算法機(jī)制的目的,并不是忽略作品的質(zhì)量問(wèn)題,去通過(guò)外力去揠苗助長(zhǎng)。這不是我的本意,我的目的要學(xué)會(huì)做一個(gè)懂得觸發(fā)機(jī)制的人去讓內(nèi)容符合算法。作品好比種子,植物能不能量產(chǎn)以及結(jié)果品質(zhì)好不好取決的是種子,非肥料,非土壤。我們需要根據(jù)算法機(jī)制去調(diào)整作品細(xì)節(jié),讓作品能觸發(fā)機(jī)制后快速上升最大化。
帶有算法機(jī)制下的場(chǎng)景變化
在這里不得不說(shuō)“頭條系",如今“頭條系”產(chǎn)品已經(jīng)成為自媒體用戶最活躍并體量龐大的巨頭平臺(tái)。他的特色就是“以用戶為中心”,只推送你喜歡的內(nèi)容,從初期適應(yīng)用戶需求到精確滿足用戶需求的目標(biāo),從而實(shí)現(xiàn)內(nèi)容定制化。
如果你被一個(gè)娛樂(lè)類型的文章或者視頻所吸引并點(diǎn)擊閱讀,之后你的內(nèi)容主頁(yè)就可能被定制成了娛樂(lè)類型。而在外后的過(guò)程中機(jī)器算法,會(huì)不斷細(xì)分采集并記錄你的行為標(biāo)簽,從而讓你喜歡看的內(nèi)容越來(lái)越精準(zhǔn),可能最后細(xì)化到只給你推送”某個(gè)明星“的相關(guān)新聞或者視頻。
算法機(jī)制下的內(nèi)容定制,等于為用戶找一個(gè)“懂你的另一半”。
抖音算法的原型

上圖就是整個(gè)算法機(jī)制的樣子,其實(shí)真正的原型遠(yuǎn)遠(yuǎn)不止這些,僅僅只是把前端的原型畫了出來(lái),而我們了解這些就已經(jīng)足夠了。
整個(gè)流程總共分三部分:給內(nèi)容貼標(biāo)簽,給人物貼標(biāo),按照標(biāo)簽智能個(gè)性化推送。
給內(nèi)容貼標(biāo)簽
那么頭條系的內(nèi)容標(biāo)簽庫(kù)會(huì)如何打呢?
內(nèi)容類目
下圖為2015年今日頭條透露出來(lái)的一份數(shù)據(jù)報(bào)告,表達(dá)是男性與女性關(guān)心的主要內(nèi)容類目


基因算法
這個(gè)標(biāo)簽類目算是頭條系的母類目,那么作為頭條系的“孩子“抖音,必然遺傳了頭條系“爸爸”原始基因并在細(xì)化非常多的小標(biāo)簽,比如娛樂(lè),可以細(xì)化到"XX明星結(jié)婚”的標(biāo)簽。
給人物貼標(biāo)簽
用戶畫像
平臺(tái)會(huì)根據(jù)用戶在使用App的習(xí)慣進(jìn)行分析行為路徑,再進(jìn)行貼標(biāo)簽,再繼續(xù)優(yōu)化標(biāo)簽。這個(gè)過(guò)程都是實(shí)時(shí)的機(jī)器算法。
那么這個(gè)采集的方法:就是個(gè)人資料的填寫,關(guān)鍵詞搜索的記錄,瀏覽的比較多的類目視頻,點(diǎn)贊視頻數(shù)據(jù),評(píng)論數(shù)據(jù),通訊錄的圈子關(guān)系等。
通過(guò)不斷的標(biāo)簽優(yōu)化升級(jí)后,呈現(xiàn)出來(lái)標(biāo)簽用戶,我們也稱之為用戶畫像,參考下圖

數(shù)據(jù)共享
先看看頭條系的產(chǎn)品(部分熱門)

頭條系會(huì)打通所有平臺(tái)的數(shù)據(jù)庫(kù),看看你在每個(gè)平臺(tái)的“偏愛(ài)標(biāo)簽”并記錄下來(lái)。
頭條系為了“以用戶為中心”,背后靠的是大數(shù)據(jù)支撐
智能標(biāo)簽推送
模擬場(chǎng)景
這次用了陪伴大家整個(gè)童年的老朋友”小明“作為我們第一人稱,嘗試模擬初次遇見《今日頭條》后轉(zhuǎn)玩《抖音》會(huì)出現(xiàn)的場(chǎng)景。

預(yù)覽順序:
當(dāng)小明第一次玩《今日頭條》后,平臺(tái)算法對(duì)小明平時(shí)每個(gè)預(yù)覽的內(nèi)容都進(jìn)行貼標(biāo)簽。最終得出了屬于小明在《今日頭條》這個(gè)平臺(tái)的標(biāo)簽畫像
當(dāng)小明通過(guò)《今日頭條》賬號(hào)登錄《抖音》后,數(shù)據(jù)共享會(huì)吧這個(gè)頭條賬號(hào)的標(biāo)簽畫像同步到抖音平臺(tái),并進(jìn)行原平臺(tái)的標(biāo)簽畫像匹配標(biāo)簽視頻內(nèi)容,智能推薦給小明
在小明玩抖音的過(guò)程中,平臺(tái)算法會(huì)多次實(shí)時(shí)統(tǒng)計(jì)小明有轉(zhuǎn)贊評(píng)行為的其他新標(biāo)簽視頻。
最后不斷智能優(yōu)化標(biāo)簽畫像,最重呈現(xiàn)出新的標(biāo)簽畫像,如下圖

優(yōu)化后同時(shí)匹配新標(biāo)簽同類視頻推送給小明,最重完成了頭條系的算法機(jī)制運(yùn)行路徑。這個(gè)過(guò)程是AI算法,會(huì)實(shí)時(shí)計(jì)算,升級(jí),優(yōu)化標(biāo)簽,而且永無(wú)止境,實(shí)現(xiàn)“用戶為中心”定制化內(nèi)容推送。
抖音的推薦機(jī)制
上面對(duì)頭條系的推薦機(jī)制整個(gè)框架有個(gè)大概的介紹,接下來(lái)介紹是關(guān)于抖音熱門強(qiáng)相關(guān)的作品推薦機(jī)制解讀
推薦模式原理圖

上傳的作品內(nèi)容皆為抖音審核員所見,具體排列順序依照:賬號(hào)資料完善度,賬號(hào)認(rèn)證情況,推薦基數(shù),視頻播放量,點(diǎn)贊數(shù),評(píng)論數(shù),分享數(shù)量,發(fā)布時(shí)間,@抖音小助手等進(jìn)行權(quán)重計(jì)分,高得分視頻排序越越靠前優(yōu)先審核。且視頻內(nèi)容為隨機(jī)分配給抖音審核員。
推薦基數(shù)
根據(jù)實(shí)際瀏覽人數(shù),時(shí)長(zhǎng),點(diǎn)贊比例,評(píng)論比例等設(shè)置的一個(gè)基礎(chǔ)值。
整個(gè)環(huán)節(jié)簡(jiǎn)化拆解為幾個(gè)步驟
流量分桶
先把你的視頻檢測(cè)標(biāo)簽,如果作品被機(jī)器貼上標(biāo)簽?zāi)敲淳蜁?huì)分桶到對(duì)應(yīng)標(biāo)簽的流量洼地。如果標(biāo)簽?zāi):裏o(wú)法貼標(biāo)簽,那么就會(huì)零散推薦,無(wú)法進(jìn)行精準(zhǔn)推送
流量分桶是什么樣子的?

送量測(cè)試
這張圖如果是自媒體老玩家是非常熟悉的,如果你是新手也沒(méi)關(guān)系,我自繪一張“大白話”版本的流量圖解

這是頭條A/B Test實(shí)驗(yàn)系統(tǒng)的基本原理。
1.首先對(duì)上傳的作品進(jìn)行機(jī)器審核;
2.為通過(guò)的視頻貼上標(biāo)簽并申請(qǐng)流量推送;
3.抖音會(huì)對(duì)實(shí)時(shí)在線用戶進(jìn)行流量分桶,每桶按照總用戶量10%分配進(jìn)行實(shí)驗(yàn)推送;
4.分配的視頻流量再進(jìn)行分配實(shí)驗(yàn)組,每個(gè)實(shí)驗(yàn)組按照5%比例分配,并為用戶貼上相近標(biāo)簽
5.把作品送量測(cè)試給首個(gè)實(shí)驗(yàn)組用戶,根據(jù)用戶反饋(CPA)“轉(zhuǎn) 評(píng) 贊 完播率” 計(jì)算作品基數(shù)
6.達(dá)到通過(guò)推薦基數(shù),繼續(xù)把作品推送下一個(gè)分配實(shí)驗(yàn)組進(jìn)行測(cè)試;
7.通過(guò)首個(gè)實(shí)驗(yàn)組的基數(shù)測(cè)試后,作品將進(jìn)入人為審核是否繼續(xù)送量測(cè)試;
抖音數(shù)據(jù)算法反饋
那么如何通過(guò)播放量自查作品進(jìn)入哪個(gè)實(shí)驗(yàn)組?我把作品從上傳到熱門優(yōu)質(zhì)池狀態(tài)這個(gè)路徑劃分為3個(gè)階段,并用播放量作為對(duì)標(biāo)的方法。
啟動(dòng)階段
小于1000播放量,這個(gè)時(shí)候1000播放量就是你的作品的種子用戶,那么這個(gè)時(shí)候作品的黃金3秒,精彩前置等手段保證初始種子用戶留存從而進(jìn)入下個(gè)階段;
小爆階段
通過(guò)多個(gè)實(shí)驗(yàn)組的送量測(cè)試后,作品進(jìn)入高展?fàn)顟B(tài),1萬(wàn)到10萬(wàn)播放量,這個(gè)時(shí)候作品影響數(shù)據(jù)的細(xì)節(jié),包含用戶引導(dǎo),開發(fā)式問(wèn)題留給大家去評(píng)論,激發(fā)二次溝通意愿。如果你的作品依然通過(guò)小爆炸階段以后,你的作品將會(huì)進(jìn)入到優(yōu)質(zhì)池狀態(tài),我稱它為王者流量池,它是一個(gè)大爆炸的階段;
大爆炸階段
進(jìn)入到這個(gè)階段,你的作品已經(jīng)進(jìn)入優(yōu)質(zhì)池狀態(tài),已經(jīng)上熱門了。抖音會(huì)給你100萬(wàn)以上的播放量,這樣子的播放量到底有多少轉(zhuǎn)化為你的粉絲,就是你自己功底的一個(gè)累積的過(guò)程了。
抖音數(shù)據(jù)影響關(guān)鍵
用戶反饋(CPA)數(shù)據(jù)
完播率:不僅僅是視頻的播放完成率,還有用戶多次播放的數(shù)據(jù),重復(fù)播放次數(shù)也會(huì)加入基數(shù)分值;
點(diǎn)贊率:用戶的點(diǎn)贊數(shù)量,和播放數(shù)的占比,影響推薦,點(diǎn)贊是源自用戶對(duì)內(nèi)容的認(rèn)可,犒賞,收藏的表達(dá)方式;
評(píng)論率:不僅包含用戶評(píng)論數(shù)量,還包含用戶查看評(píng)論數(shù)量,評(píng)論點(diǎn)贊數(shù)量;
轉(zhuǎn)發(fā)率:不同渠道的轉(zhuǎn)發(fā),包含是否在評(píng)論里面@好友;
粉絲量:包含現(xiàn)有粉絲量,新增關(guān)注粉絲量及去關(guān)粉絲量,幾種分值算法;
進(jìn)入主頁(yè):通過(guò)作品進(jìn)入用戶主頁(yè)也有加分,預(yù)覽其他作品數(shù)量及次數(shù),還額外關(guān)系賬號(hào)權(quán)重;
查看音樂(lè):通過(guò)作品查看音樂(lè)也會(huì)有基數(shù),以及背景音樂(lè)是否原生;
這里面的基數(shù)分值權(quán)重是直接影響作品權(quán)重,很多人不會(huì)分享這里面的細(xì)節(jié)。今天我們大無(wú)私分享。
看到上面的基數(shù)分值的方法有沒(méi)有發(fā)現(xiàn)一個(gè)特別有趣的點(diǎn)?
其實(shí)15秒的視頻權(quán)重一般情況下會(huì)大于60秒視頻的權(quán)重,也就是做新手賬號(hào)與大號(hào)在同個(gè)起跑線的同時(shí),新手號(hào)作品基數(shù)分值會(huì)比大號(hào)更高,因?yàn)楹芏?0秒的作品在完播率這塊就加分很少,15秒一瞬而過(guò)反而導(dǎo)致觀眾會(huì)意猶未盡重復(fù)觀看,那么15秒作品=完播率+重復(fù)播放率
作品影響數(shù)據(jù)的關(guān)鍵點(diǎn)
拍攝與剪輯
? ? (正確指標(biāo))畫面清晰流暢,匹配字幕,調(diào)色符合內(nèi)容:如美食(暖色調(diào)),背景干凈唯美,聲音清晰悅耳;
? ? (錯(cuò)誤指標(biāo)) 畫面模糊,分辨率低(非絕對(duì),手機(jī)原生拍攝也是可以通過(guò))。聲音含糊不清,色調(diào)讓人產(chǎn)生不舒服的感覺(jué),背景雜亂,分散注意力。一般出現(xiàn)這些現(xiàn)象的作品,那它可能已經(jīng)在人工審核環(huán)節(jié)被PASS,無(wú)法進(jìn)入下個(gè)階段的推送。
影響上熱門關(guān)鍵因素
審核不通過(guò)因素

推薦機(jī)制全過(guò)程

從上傳→審核→識(shí)別→推薦,如果推薦數(shù)據(jù)指標(biāo)高于基數(shù)分值視為正,作品將會(huì)繼續(xù)推薦。如果推薦的基數(shù)反饋低于基數(shù)則為負(fù)那么將停止推薦。這就是整個(gè)推薦機(jī)制的全過(guò)程。
熱度強(qiáng)相關(guān)的轉(zhuǎn)化率

上圖表達(dá)了關(guān)于轉(zhuǎn)化比強(qiáng)關(guān)系的要素,那么轉(zhuǎn)化率直接影響的是作品熱度。
讓內(nèi)容更貼近算法
上面內(nèi)容對(duì)于作品的基數(shù)分值針對(duì)哪些會(huì)有關(guān)聯(lián)進(jìn)行介紹,那么在推薦機(jī)制中對(duì)于內(nèi)容的標(biāo)簽關(guān)聯(lián)的計(jì)算方式是怎么樣的?了解內(nèi)容標(biāo)簽匹配過(guò)程,能讓我們往后對(duì)于自己的作品的用戶垂直度能做到更細(xì)微的調(diào)整,讓算法更好的收錄自己的作品并進(jìn)行多次的推薦。
分類
Step.1 短視頻A進(jìn)入推薦系統(tǒng)后,系統(tǒng)根據(jù)上傳設(shè)定的分類“體驗(yàn)”將其放置體育分類池中;
標(biāo)題
Step.2 系統(tǒng)抓取短視頻A標(biāo)題《姚明大動(dòng)作,男籃設(shè)兩隊(duì)兩主帥》中的關(guān)鍵詞,“姚明”?!澳谢@”;
用戶垂直精準(zhǔn)度,標(biāo)題+封面
Step.3 系統(tǒng)匹配用戶數(shù)據(jù)中標(biāo)有“姚明” “男籃”? 所對(duì)應(yīng)“體育”“籃球”“男籃”等標(biāo)簽的用戶,小量級(jí)試探推薦,觀察用戶是否感興趣觀看并有良性反饋;
用戶垂直精準(zhǔn)度
Step.4 繼而擴(kuò)大量級(jí)推薦,并根據(jù)“姚明”,“男籃”關(guān)聯(lián)更多關(guān)鍵詞及標(biāo)簽用戶,如“NBA","CBA","奧尼爾”等.......
抖音推薦邏輯的3個(gè)關(guān)鍵詞
基礎(chǔ)流量:標(biāo)題,封面,分類標(biāo)簽,用戶垂直精準(zhǔn)度影響;
疊加推薦:對(duì)用戶垂直精致度,有沒(méi)有足夠了解;
時(shí)間效應(yīng):賬號(hào)翻紅的可能性,舊的內(nèi)容給到新的用戶;
整篇文章針對(duì)當(dāng)下抖音的算法機(jī)制由淺到深,由大到小的介紹,主要目的是讓抖音的內(nèi)容生產(chǎn)者能深刻了解抖音的算法框架,對(duì)于自己的作品的細(xì)節(jié)能進(jìn)行調(diào)整,讓作品自觸發(fā)算法更好的上熱門。后面我們會(huì)教大家如何更好的玩好這個(gè)機(jī)制,解鎖各路熱門視頻的套路。
文章首發(fā):《TOP 達(dá)人》:看
下篇預(yù)告:《抖音功能背后的秘密》