最近在看王喆的知乎專欄,第三、四、十三篇都是Youtube的經(jīng)典論文DNN:https://zhuanlan.zhihu.com/p/52169807https://zhua...
最近在看王喆的知乎專欄,第三、四、十三篇都是Youtube的經(jīng)典論文DNN:https://zhuanlan.zhihu.com/p/52169807https://zhua...
好久沒(méi)寫(xiě)了,看了一下中間隔了居然有一個(gè)月,這種沒(méi)有活水流入的生活,確實(shí)會(huì)讓人feel bad; 這篇要講到DQN,主要是Nature2015那版(在這之前還有一版NIPS20...
Q-learning: 這里并不知道為啥每一輪都要初始化s,但是在每一輪需要采取動(dòng)作的每一步(step)要做的事情如下: 根據(jù)epsilon-greedy策略在當(dāng)前狀態(tài)s選擇...
from:http://m.itdecent.cn/p/295d7a8ebe48 都說(shuō)要做強(qiáng)化學(xué)習(xí)先要搞明白馬爾可夫決策過(guò)程,也還沒(méi)明白為啥,先弄明白是啥吧。 一個(gè)馬爾...
通過(guò)上一節(jié)的zhihu鏈接明白了從這開(kāi)始講ee,以及后面講rl的原因,都是源自這個(gè)zhihu專欄:https://zhuanlan.zhihu.com/p/32311522?...
bandit基礎(chǔ)看了一下并不是很難,先記錄一下,文集里沒(méi)有貼個(gè)公眾號(hào)地址吧:https://mp.weixin.qq.com/s?src=11×tamp=16358...
參考:http://m.itdecent.cn/p/6173dbde4f53 NCF全稱Neural Collaborative Filtering,講道理第一遍看的時(shí)...
文集里的下一篇是AUC,應(yīng)該也是我看的第一篇了,重新看了之后,梳理了一些易忘的和以前沒(méi)考慮過(guò)的,再拎出來(lái)寫(xiě)一下。 1.為什么AUC的最低值為0.5 根據(jù)文章鏈接出的回答:ht...
Deepfm是把FM和DNN并行了,但是其實(shí)FM和DNN還有一種串行模式,接下來(lái)要講的這三種就是; 先說(shuō)PNN,老規(guī)矩先放圖(http://m.itdecent.cn/...
這是上一篇W&D留下的一個(gè)坑,填一下吧。 先從FTRL要解決的邏輯回歸簡(jiǎn)單說(shuō)起,邏輯回歸的損失函數(shù)是logloss(公式就不列了),那為什么搞這么個(gè)loss而不搞熟悉親切的m...
雖然叫Wide&Deep等,但是這個(gè)等也是DeepFM和DCN這種大名鼎鼎的模型,下面分別介紹一下。 1.Wide&Deep Wide&Deep的背景是說(shuō)模型既需要記憶也需要...
也是深度學(xué)習(xí)面試??嫉臇|西,BN、LN、GN、IN等各種N,參考文章:https://zhuanlan.zhihu.com/p/115949091 定義其實(shí)一張圖基本就能說(shuō)明...
上一篇說(shuō)了一下改進(jìn)梯度的最優(yōu)化算法,下面說(shuō)一下自適應(yīng)學(xué)習(xí)率算法,以及兩者的結(jié)合。自適應(yīng)學(xué)習(xí)率算法主要是相對(duì)不同參數(shù)和訓(xùn)練的不同階段有不同的學(xué)習(xí)率。 1.自適應(yīng)學(xué)習(xí)率算法 ——...
深度學(xué)習(xí)優(yōu)化器應(yīng)該是面試都會(huì)??嫉臇|西,很慚愧到現(xiàn)在才搞清楚,基于這個(gè)blog:https://blog.csdn.net/BVL10101111/article/detai...
這篇LR+GBDT的文章http://m.itdecent.cn/p/4680ac3503d8其實(shí)沒(méi)怎么講LR,全都是在講GBDT怎么做特征工程 其實(shí)就是構(gòu)造多棵樹(shù),然...
也是一篇早就要寫(xiě)的文章,對(duì) http://m.itdecent.cn/p/152ae633fb00 和 http://m.itdecent.cn/p/781cde...
老早就改總結(jié)的一篇了 參考: https://www.cnblogs.com/wmx24/p/10157154.html https://mp.weixin.qq.com/s...
想學(xué)習(xí)推薦系統(tǒng),如何從小白成為高手(https://www.zhihu.com/question/23194692)里有一個(gè)回答說(shuō): “關(guān)于推薦系統(tǒng),如果忘掉所有的公式和代碼...
http://m.itdecent.cn/p/a245201d3dbe 1.平均值預(yù)測(cè):全局平均、用戶平均、物品平均、同類平均 2.領(lǐng)域評(píng)測(cè):還是通過(guò)用戶對(duì)其他物品的評(píng)...
今天粗略看了一遍SVD:https://zhuanlan.zhihu.com/p/37038542,既然看了就總結(jié)一下 1.用處:降維、壓縮空間 2.解釋:什么是奇異值分解 ...