SVM支持向量機

線性可分支持向量機

特點

  1. 二分類問題
  2. 輸入空間:歐式空間或離散集合
  3. 特征空間:歐式空間或希爾伯特空間
  4. 線性可分支持向量機、線性支持向量機:假設(shè)這兩個空間的元素一一對應(yīng),并將輸入空間中的輸入映射為特征空間中的特征向量

理論模型

  1. 假設(shè)特征空間上的訓(xùn)練數(shù)據(jù)集:


    假設(shè)
  2. 線性可分支持向量機:給定線性可分訓(xùn)練數(shù)據(jù)集,通過間隔最大化或等價地求解相應(yīng)的凸二次規(guī)劃問題學習得到的分離超平面為


    超平面
  3. 決策函數(shù)


    決策函數(shù)

函數(shù)間隔和幾何間隔

  1. 點到分離超平面的遠近
    確信程度

    表示分類預(yù)測的確信程度,
    符號
    的符號與類標記y的符號是否一致表示分類是否正確,所以
    正確性
    表示分類的正確性
  2. 函數(shù)間隔
    樣本點的函數(shù)間隔


    函數(shù)間隔

    訓(xùn)練數(shù)據(jù)集的函數(shù)間隔


    函數(shù)間隔
  3. 幾何間隔
    樣本點的幾何間隔


    幾何間隔

    訓(xùn)練數(shù)據(jù)集的幾何間隔


    幾何間隔

間隔最大化

  1. 最大間隔分類超平面


    最大間隔
  2. 根據(jù)幾何間隔和函數(shù)間隔的關(guān)系,問題轉(zhuǎn)化為


    間隔
  3. 因為函數(shù)間隔并不影響問題的最優(yōu)解,所以我們令函數(shù)間隔為1.線性可分支持向量機學習可以轉(zhuǎn)化為以下最優(yōu)化問題


    最優(yōu)化問題

拉格朗日對偶

給每一個約束條件加上一個拉格朗日乘子

,定義拉格朗日函數(shù)



這里我們把X看做常量,對
求其最大值

在滿足約束的條件下,目標函數(shù)變?yōu)榱?/p>


轉(zhuǎn)化為對偶問題

*** 通過拉格朗日對偶重新定義一個無約束問題,這個無約束問題等價于原來的約束優(yōu)化問題,從而將約束問題無約束化! ***

求解對偶問題的步驟

  1. 首先固定
    要讓 L 關(guān)于 w 和 b 最小化,我們分別對w,b求偏導(dǎo)數(shù),即令 ?L/?w 和 ?L/?b 等于零


    最后,得到:
  2. 計算



  3. 求得分離超平面


  4. 分類決策函數(shù)


*** 分類決策函數(shù)只依賴于輸入x和訓(xùn)練樣本輸入的內(nèi)積,上式稱為線性可分支持向量機的對偶形式 ***

線性支持向量機與軟間隔最大化

引入松弛變量和懲罰參數(shù)

  1. 構(gòu)造并求解約束最優(yōu)化問題


  2. 計算



    并選擇α*,適合條件



    計算:

非線性支持向量機與核函數(shù)

核技巧應(yīng)用到支持向量機,其基本想法:
通過一個非線性變換將輸入空間(歐氏空間R”或離散集合)對應(yīng)于一個特征空間(希爾伯特空間),使得在輸入空間中的超曲面模型對應(yīng)于特征空間中的超平面模型(支持向量機)。分類問題的學習任務(wù)通過在特征空間中求解線性支持向量機就可以完成.

多項式核函數(shù)

高斯核


如果σ選得很大的話,高次特征上的權(quán)重實際上衰減得非???,所以實際上(數(shù)值上近似一下)相當于一個低維的子空間;反過來,如果選得很小,則可以將任意的數(shù)據(jù)映射為線性可分——當然,這并不一定是好事,因為隨之而來的可能是非常嚴重的過擬合問題。不過,總的來說,通過調(diào)控參數(shù)σ,高斯核實際上具有相當高的靈活性,也是使用最廣泛的核函數(shù)之一

序列最小最優(yōu)化算法SMO

  1. 解如下凸二次規(guī)劃的對偶問題


  2. 啟發(fā)式算法,基本思路
    如果所有變量的解都滿足此最優(yōu)化問題的KKT條件,那么得到解
    否則,選擇兩個變量,固定其它變量,針對這兩個變量構(gòu)建一個二次規(guī)劃問題,稱為子問題,可通過解析方法求解,提高了計算速度
    子問題的兩個變量:一個是違反KKT條件最嚴重的那個,另一個由約束條件自動確定


  3. 兩個變量二次規(guī)劃的求解過程
    選擇兩個變量,其它固定



    假設(shè)問題的初始可行解為



    最優(yōu)解

    設(shè)α2未經(jīng)剪輯時的最優(yōu)解為

    則有



    最優(yōu)化問題沿約束方向未經(jīng)剪輯的解

    剪輯后的解

    得到α1的解
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 轉(zhuǎn)自微信公眾號:機器學習算法與Python學習 統(tǒng)計學習方法 & 小象學院 SVM算法優(yōu)點: 可用于線性/非線性分...
    士多啤梨蘋果橙_cc15閱讀 1,099評論 0 2
  • SVM是數(shù)據(jù)挖掘算法中比較復(fù)雜難懂的,反復(fù)觀看斯坦福機器學習的視頻, 以及網(wǎng)上零散學習各種數(shù)學和SVM相關(guān)資料, ...
    wujustin閱讀 22,508評論 0 20
  • 囫圇吞棗看完SVM,個人感覺如果不好好理解一些概念,或說如果知其然而不知其所以然的話,不如不看。因此我想隨便寫一寫...
    煎魚不可能有BUG閱讀 17,972評論 2 38
  • 【概述】 SVM訓(xùn)練分類器的方法是尋找到超平面,使正負樣本在超平面的兩側(cè)(分類正確性即“分得開”),且樣本到超平面...
    sealaes閱讀 11,625評論 0 7
  • 非線性支持向量機與核函數(shù) 對解線性分類問題,線性分類支持向量機是一種非常有效的方法。但是有些分類問題的非線性的。其...
    士多啤梨蘋果橙_cc15閱讀 401評論 0 0

友情鏈接更多精彩內(nèi)容