降維與度量學習

1.kNN算法:給定測試樣本,基于某種距離度量,找出訓練集中與其最近靠近的k個訓練樣本,然后基于這k個鄰居的信息進行預測.通常分類任務中,使用“投票”法;回歸任務中,使用“平均”法。

2.維數(shù)災難(curse of dimensionality):高維情形下,數(shù)據(jù)樣本稀疏、距離計算困難。

3.降維(dimension reduction)。pca一種降維方法。

4. root mean square error(RMSE):a typical performance measure for regression problems.

5. sklearn.preprocessing.OneHotEncoder:a OneHotEncoder encoder converts integer categorical values into to one-hot vectors。

6. feature scaling:min-max scaling、standardization。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容