《概率機器人》學習筆記

介紹

這篇文章用于記錄《概率機器人》(《Probalbilistic Robotics》)這本書的學習筆記和心得,將會主要按照書中的章節(jié)進行組織,穿插一些補充內容和自己的理解。

筆記

第一章:緒論

  • 概率機器人的主要思想就是用概率理論的運算去明確地表示機器人感知和行為的不確定性。換句話說,不再只依賴可能出現(xiàn)情況的單一的“最好推測”,而是用概率算法來表示在整個推測空間的概率分布信息。

第二章:遞歸狀態(tài)估計

概率基礎

  • 概率密度函數(shù)(Probability Density Function,PDF)
  • 正態(tài)分布\mathscr{N}(x;\mu,\sigma^2)p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}exp({-\frac{1}{2}\frac{(x-\mu)^2}{\sigma^2}})
  • 多元正態(tài)分布\mathscr{N}(x;\mu,\Sigma)p(x)=\frac{1}{\sqrt{det(2\pi\Sigma)}}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))
  • 聯(lián)合分布、相互獨立、條件概率(略)
  • 全概率定理(theorem of total probability):p(x)=\sum_yp(x|y)p(y) p(x)=\int p(x|y)p(y)dy
  • 貝葉斯準則(Bayes rule):p(x|y)=\frac{p(y|x)p(x)}{p(y)}該準則將條件概率p(x|y)與其逆概率p(y|x)聯(lián)系起來。如果x是一個希望由y推測出來的數(shù)值,則概率p(x)稱為先驗分布,總結了在綜合數(shù)據(jù)y之前已經(jīng)有的關于x的信息。p(x|y)稱為后驗概率分布。
  • 期望(expectation)是隨機變量的線性函數(shù)
  • 協(xié)方差:Cov(X)=\mathbb{E}[(X-\mathbb{E}[X])^2]=\mathbb{E}[X^2]-\mathbb{E}[X]^2
  • 熵(entropy):H_p(x)=\mathbb{E}[-log_2p(x)]

機器人環(huán)境交互

  • x表示狀態(tài),z表示測量,u表示控制。
  • 狀態(tài)完整假設
  • 狀態(tài)轉移概率:p(x_t|x_{0:t-1},z_{0:t-1},u_{0:t})=p(x_t|x_{t-1},u_t)
  • 測量概率:p(z_t|x_{0:t},z_{0:t-1},u_{0:t})=p(z_t|x_{t})
  • 置信度:bel(x_t)=p(x_t|z_{0:t},u_{0:t})
  • 剛執(zhí)行完控制u_t,綜合z_t之前計算后驗:\overline{bel}(x_t)=p(x_t|z_{0:t-1},u_{0:t})

基本的貝葉斯濾波算法(P20)
包括計算\overline{bel}(x_t)(預測)和計算bel(x_t)(更新)兩個步驟。
其中:
\overline{bel}(x_t)=\int p(x_t|u_t,x_{t-1})bel(x_{t-1})dx_{t-1} bel(x_t)=\eta p(z_t|x_t)\overline{bel}(x_t)

第三章:高斯濾波

  • 基本思想:用多元正態(tài)分布表示置信度
  • 矩參數(shù)(Moments parameterization):均值和方差

卡爾曼濾波(Kalman Filter)

  • 適合具有如下三個特性的系統(tǒng):狀態(tài)轉移概率是帶有隨機高斯噪聲的參數(shù)的線性函數(shù);測量概率與帶有高斯噪聲的自變量呈線性關系;初始置信度是正態(tài)分布的。
  • 利用了性質:高斯隨機變量的任何線性變換都將導致另一個高斯隨機變量;高斯隨機變量相乘也會導致高斯隨機變量。
  • 首先通過綜合控制u_t計算預測的置信度參數(shù)\overline{\mu}_t\overline{\Sigma}_t;隨后通過綜合測量z_t計算卡爾曼增益并更新置信度\mu_t\Sigma_t

擴展卡爾曼濾波(Extented Kalman Filter)

  • 實際上狀態(tài)轉移和測量很少是線性的。
  • 擴展卡爾曼濾波放寬了一個假設:線性化假設。這里假設狀態(tài)轉移概率和測量概率分別由非線性函數(shù)控制。
  • EKF計算真實置信度的高斯近似值。
  • 利用一階泰勒展開的方法,從狀態(tài)轉移方程和測量方程中線性化的到兩個雅可比矩陣。

無跡卡爾曼濾波

  • 通過使用加權統(tǒng)計線性回歸過程實現(xiàn)隨機線性化。
  • 無跡變換(unscented transform),通過提取確定的\sigma點,并將它們經(jīng)過變換函數(shù)得到新的值,從而估計新的高斯概率分布。

第四章:非參數(shù)濾波

  • 非參數(shù)濾波不依賴確定的后驗函數(shù)
  • 能很好地表示復雜的多峰置信度

直方圖濾波

  • 分解技術:靜態(tài)和動態(tài)
  • 動態(tài)分解技術最主要的一個例子就是密度樹。
  • 選擇更新。

靜態(tài)二值貝葉斯濾波

  • 狀態(tài)靜止時
  • 概率比的對數(shù):l(x):=log\frac{p(x)}{1-p(x)}
  • 反向測量模型:p(x|z_t)
  • 更新算法:l_t = l_{t-1}+log\frac{p(x|z_t)}{1-p(x|z_t)}-log\frac{p(x)}{1-p(x)}

粒子濾波

  • 步驟:首先構造一個暫時的粒子集\overline{\chi},表示置信度\overline{bel}(x_t),其中每個粒子都由\chi_{t-1}中的一個粒子經(jīng)過u_t預測隨機取樣得到,隨后\overline{\chi}中的每個粒子通過z_t賦予一個權重,最后按照權重進行重采樣/重要性采樣。
  • 重采樣對迫使粒子回歸后驗bel(x_t)有重要的作用。

第五章:機器人運動

速度運動模型

里程計運動模型

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容