K-鄰近算法

K-鄰近算法
采用測量不同特征值之間的距離來進行分類

  • Ad:精度高,對異常值不敏感,無數據輸入假定
  • Na:計算復雜度高,空間復雜度高

KNN原理

存在樣本集,每個數據都存在標簽,輸入無標簽的新數據后,算法提取出特征最相似的標簽。
一般選取前K個數據,通常K不大于20,最后選擇K個最相似的數據中出現(xiàn)次數最多的分類,作為新數據的分類標簽。

適用

數值型和標稱型

算法流程

  • 收集數據
    any method

  • 準備數據
    計算距離數值,最好為格式化的數據

  • 分析數據
    any method

  • 訓練算法
    不適用KNN算法

  • 測試算法
    計算錯誤率

  • 使用算法
    實際應用
    ?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容