10
0
2
3604
3
一、馬爾可夫 1.馬爾科夫過程 如果一個狀態(tài)轉移是符合馬爾科夫的,那就是說下一個狀態(tài)只與當前狀態(tài)有關,與當前狀態(tài)之前的狀態(tài)沒有關系。馬爾科夫性:也就是說,未來的轉移跟過去是獨...
1.引入 ★ 強化學習真正的火起來是在2016年,AlphaGo程序的大獲全勝,吸睛無數。 2013年,DeepMind團隊利用強化學習技術玩雅達利游戲,擊敗人類玩家,并在2...