08 特征工程 - 特征降維 - LDA

線性判斷分析(LDA): LDA是一種基于分類模型進(jìn)行特征屬性合并的操作,是一種有監(jiān)督的降維方法。

LDA原理

LDA的全稱是Linear Discriminant Analysis(線性判別分析),是一種有監(jiān)督學(xué)習(xí)算法。

LDA的原理是,將帶上標(biāo)簽的數(shù)據(jù)(點(diǎn)),通過投影的方法,投影到維度更低的空間中,使得投影后的點(diǎn),會形成按類別區(qū)分,一簇一簇的情況,相同類別的點(diǎn),將會在投影后的空間中更接近。用一句話概括就是:“投影后類內(nèi)方差最小,類間方差最大”

下圖中,左邊的映射效果還不是很好,甚至有些分類還重合到了一起。右邊的映射效果很好,達(dá)到了類內(nèi)數(shù)據(jù)方差小,類與類之間方差大。

下圖中的柱狀圖 表示有多少點(diǎn)落在了這一區(qū)間內(nèi)。柱越高,說明這部分的數(shù)據(jù)越稠密。顯然右邊的方差會小于左邊的方差。


如何求解LDA問題

假定轉(zhuǎn)換為w,那么線性轉(zhuǎn)換函數(shù)為x’= wTx; 并且轉(zhuǎn)換后的數(shù)據(jù)是一維的。

考慮二元分類的情況,認(rèn)為轉(zhuǎn)換后的值大于某個閾值,屬于某個類別,小于等于某個閾值,屬于另外一個類別,使用類別樣本的中心點(diǎn)來表示類別信息,那么這個時候其實(shí)就相當(dāng)于讓這兩個中心的距離最遠(yuǎn):

μj 表示原本數(shù)據(jù)的中心點(diǎn)。
μ‘j 表示原始數(shù)據(jù)經(jīng)過坐標(biāo)軸轉(zhuǎn)換之后,新數(shù)據(jù)的中心點(diǎn)。

同時又要求劃分之后同個類別中的樣本數(shù)據(jù)盡可能的接近,也就是同類別的投影點(diǎn)的協(xié)方差要盡可能的小。

結(jié)合著兩者,那么我們最終的目標(biāo)函數(shù)就是:

對目標(biāo)函數(shù)進(jìn)行轉(zhuǎn)換(A、B為方陣,A為正定矩陣):

該式子和PCA降維中的優(yōu)化函數(shù)一模一樣,所以直接對中間的矩陣進(jìn)行矩陣分解即可。


PCA和LDA

相同點(diǎn):
1、 兩者均可以對數(shù)據(jù)完成降維操作。
2、 兩者在降維時候均使用矩陣分解的思想。
3、 兩者都假設(shè)數(shù)據(jù)符合高斯分布。

不同點(diǎn):
1、 LDA是監(jiān)督降維算法,PCA是無監(jiān)督降維算法。
2、 LDA降維最多降到類別數(shù)目k-1的維數(shù),而PCA沒有限制。
3、 LDA除了降維外,還可以應(yīng)用于分類。
4、 LDA選擇的是分類性能最好的投影,而PCA選擇樣本點(diǎn)投影具有最大方差的方向。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • (第一部分 機(jī)器學(xué)習(xí)基礎(chǔ))第01章 機(jī)器學(xué)習(xí)概覽第02章 一個完整的機(jī)器學(xué)習(xí)項(xiàng)目(上)第02章 一個完整的機(jī)器學(xué)習(xí)...
    SeanCheney閱讀 4,375評論 0 26
  • 在現(xiàn)實(shí)生活中很多機(jī)器學(xué)習(xí)問題有上千維,甚至上萬維特征,這不僅影響了訓(xùn)練速度,通常還很難找到比較好的解。這樣的問題成...
    wong11閱讀 62,179評論 0 36
  • 很多機(jī)器學(xué)習(xí)的問題都會涉及到有著幾千甚至數(shù)百萬維的特征的訓(xùn)練實(shí)例。這不僅讓訓(xùn)練過程變得非常緩慢,同時還很難找到一個...
    城市中迷途小書童閱讀 4,101評論 0 2
  • 06 特征工程 - 特征選擇 特征降維必須在特征選擇做完以后才能進(jìn)行。 當(dāng)特征選擇完成后,可以直接可以進(jìn)行訓(xùn)練模型...
    白爾摩斯閱讀 3,778評論 0 24
  • 一.判別分析降維 LDA降維和PCA的不同是LDA是有監(jiān)督的降維,其原理是將特征映射到低維上,原始數(shù)據(jù)的類別也...
    wlj1107閱讀 12,396評論 0 4

友情鏈接更多精彩內(nèi)容