csci561 期末復(fù)習(xí)

1.UCS DFS BFS A* search

2.Game Minimax, αβ pruning

3.CSP

4.FOL resolution proof 將結(jié)果取反,和原有條件搞出空集

5.Inference in FOL

  • forward chaining 由已知條件modus poneus和and introduction 得到最后結(jié)果
  • backward chaining 從結(jié)果出發(fā)進(jìn)行替換得到所有結(jié)果,要畫圖的

6.CNF

7.Planing

  • Partial Order Plan

8.Neural Network 給一個網(wǎng)絡(luò)看輸出是什么或者設(shè)計(jì)

9.Naive Bayes

  • 給一個情景,算概率
  • 畫Bayesian Network

10.Decision Tree

  • 分類
  • 算information Gain
image.png
image.png

11.Markov Decision Processes

  • 箭頭是Reward,每個格子里的是Untility U(s) = R(s)+??maxa∑s1(P(s1|s,a)U(s1))
  • 把格子填滿后,各個方向就是Q值,Q值的計(jì)算:
    如果計(jì)算完U值要計(jì)算Q值,就是用下面的式子:
    有了策略π和立即回報函數(shù)r(s,a), Qπ(s,a)如何得到的呢?
    對s11計(jì)算Q函數(shù)(用到了上面Vπ的結(jié)果)如下:
    Qπ(s11,ar)=r(s11,ar)+ γ Vπ(s12) =0+0.9100 = 90
    Qπ(s11,ad)=r(s11,ad)+ γ *Vπ(s21) = 72

Q值怎么計(jì)算:Q(E,3,2)那就是MaxQ(4,2)=U(4,2) 既是相應(yīng)方向相鄰格子的U(也是maxQ)

  • 增強(qiáng)式學(xué)習(xí)要注意 第一次不改值,只是找到terminal在哪里
  • 這個是增強(qiáng)式學(xué)習(xí)的時候的式子,一般會給怎么行動的,Q(s,a)← Q(s,a) + ?(R(s)+?? maxa’Q(s’,a’)?Q(s,a))

γ越大,小鳥就會越重視以往經(jīng)驗(yàn),越小,小鳥只重視眼前利益(R)
α學(xué)習(xí)速率(learning rate),γ折扣因子(discount factor)。根據(jù)公式可以看出,學(xué)習(xí)速率α越大,保留之前訓(xùn)練的效果就越少。折扣因子γ越大,

max_aQ(S', a)
所起到的作用就越大。
小鳥在對狀態(tài)進(jìn)行更新時,會考慮到眼前利益(R),和記憶中的利益
max_aQ(S', a)
)。

image.png

12.Decision Networks

  • Compute expected utility (EU)
  • EU(AT∧?SB) = P(Acc|AT∧?SB)·U(Acc∧?SB) +P(?Acc|AT∧?SB)·U(?Acc∧?SB)
    隨機(jī)事件在兩個選擇下的概率乘以Utility
image.png

13.Choose 2 homework3 projects, each one about a different dataset

Describe how each project relates to search, knowledge representation, reasoning about uncertainty, learning
Compare and contrast the two projects, describing limitations and strengths

14.Expected Untility

image.png

a 是action ,s'是a這個動作導(dǎo)致的結(jié)果,e是已經(jīng)發(fā)生的事情 比如 J,M

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 背景 一年多以前我在知乎上答了有關(guān)LeetCode的問題, 分享了一些自己做題目的經(jīng)驗(yàn)。 張土汪:刷leetcod...
    土汪閱讀 12,936評論 0 33
  • Neil Zhu,簡書ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist...
    朱小虎XiaohuZhu閱讀 12,322評論 7 17
  • 這天下午,我和閨蜜琪琪約好了午飯。因?yàn)轳R上要開學(xué)了,所以我們將要又有好長的時間見不到面了。舍不得,才要認(rèn)認(rèn)真真的多...
    阿俊xi閱讀 174評論 0 0
  • 感賞我今天早起去爬山,雖然雨很大,可是我還是找到了一處鍛煉的地方,感賞我今天又完成了一萬步的計(jì)劃,并捐了步數(shù),感賞...
    畫中人11閱讀 250評論 3 1
  • 第一章 什么是社會心理學(xué) “事物是發(fā)展變化的” “盡管事物在變化,但我們不要以為所有的變化都是向著人道主義的方向發(fā)...
    小龍脫口秀閱讀 1,220評論 0 6

友情鏈接更多精彩內(nèi)容