協(xié)方差矩陣和散布(散度)矩陣

兩者的關(guān)系: 散度矩陣 = 協(xié)方差矩陣 ×(n-1)

協(xié)方差矩陣

對于二維隨機變量(X,Y)之間的相互關(guān)系的數(shù)字特征,我們用協(xié)方差來描述,記為 Cov(X,Y):
Cov(x,y) = \frac{1}{n-1}\sum_{i=1}^{n}(X-\tilde{X})(Y-\tilde{Y})
其中 \tilde{X}\tilde{Y} 分別為變量的均值
那么二維隨機變量(X,Y)的協(xié)方差矩陣為:
C_{2*2} = \bigl(\begin{smallmatrix} c_{11} & c_{12}\\ c_{21} & c_{22} \end{smallmatrix}\bigr) = \bigl(\begin{smallmatrix} Cov_{X,X}& Cov_{X,Y}\\ Cov_{Y,X} & Cov_{Y,Y} \end{smallmatrix}\bigr)

    1. 注意協(xié)方差和協(xié)方差矩陣的區(qū)別,協(xié)方差是一個值,而所有維度的協(xié)方差構(gòu)成的矩陣才是協(xié)方差矩陣
    1. 協(xié)方差矩陣是一個對稱矩陣,且是半正定矩陣,主對角線是各個隨機變量的方差。
    1. 標準差和方差一般是用來描述一維數(shù)據(jù)的;對于多維情況,而協(xié)方差是用于描述任意兩維數(shù)據(jù)之間的關(guān)系,一般用協(xié)方差矩陣表示。因此協(xié)方差矩陣計算的是不同維度之間的協(xié)方差,而不是不同樣本之間的。

協(xié)方差矩陣的幾何意義

為了更好理解協(xié)方差矩陣的幾何意義,下面以二維正態(tài)分布圖為例:

  • 均值 u = [0,0], 協(xié)方差矩陣為 c = \begin{bmatrix} 5 & 0 \\ 0&1 \end{bmatrix},則樣本分布圖的 XOY 平面是橢圓形,主軸方向平行水平 X 軸。
  • 均值 u = [0,0], 協(xié)方差矩陣為 c = \begin{bmatrix} 5 & 0 \\ 0& 5 \end{bmatrix},則樣本分布圖的 XOY 平面是橢圓形,主軸方向平行水平 X 軸。
  • 均值[0,0]代表正態(tài)分布的中心點,方差代表其分布的形狀。
  • 協(xié)方差矩陣 C 的最大特征值 D 對應(yīng)的特征向量 V 指向樣本分布的主軸方向。例如,最大特征值 D1=5對應(yīng)的特征向量V1=\begin{bmatrix} 1& 0 \end{bmatrix}^T即為樣本分布的主軸方向(一般認為是數(shù)據(jù)的傳播方向)。次大特征值D2=1對應(yīng)的特征向量V2=\begin{bmatrix} 0& 1 \end{bmatrix}^T,即為樣本分布的短軸方向。
  • 由于協(xié)方差矩陣 C 具有兩個相同的特征值D1=D2=5,因此樣本在V1和V2特征向量方向的分布是等程度的,故樣本分布是一樣圓形。
  • 特征值 D1 和 D2 的比值越大,數(shù)據(jù)分布形狀就越扁;當比值等于1時,此時樣本數(shù)據(jù)分布為圓形。

總結(jié)

  • 樣本均值決定樣本分布中心點的位置。
  • 協(xié)方差矩陣決定樣本分布的扁圓程度。
  • 偏向方向(數(shù)據(jù)傳播方向)由特征向量決定。最大特征值對應(yīng)的特征向量,總是指向數(shù)據(jù)最大方差的方向(橢圓形的主軸方向)。次大特征向量總是正交于最大特征向量(橢圓形的短軸方向)
  • 協(xié)方差矩陣(散布矩陣)在模式識別中應(yīng)用廣泛,最典型的應(yīng)用是PCA主成分分析了,PCA主要用于降維,其意義就是將樣本數(shù)據(jù)從高維空間投影到低維空間中,并盡可能的在低維空間中表示原始數(shù)據(jù)。這就需要找到一組最合適的投影方向,使得樣本數(shù)據(jù)往低維投影后,能盡可能表征原始的數(shù)據(jù)。此時就需要樣本的協(xié)方差矩陣。PCA算法就是求出這堆樣本數(shù)據(jù)的協(xié)方差矩陣的特征值和特征向量,而協(xié)方差矩陣的特征向量的方向就是PCA需要投影的方向。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容