為什么現(xiàn)在機(jī)器學(xué)習(xí)突然如此火爆

?

圖片發(fā)自簡(jiǎn)書(shū)App

而今機(jī)器學(xué)習(xí)的改進(jìn)大致在兩個(gè)方面,一方面是軟件,就是算法方面,從最小二乘法出發(fā),到貝葉斯思想。另一方面就是硬件,一是采用并行計(jì)算,比如GPGPU,FPGA;二是分布式計(jì)算,比如Apache的Hadoop,把任務(wù)劃分成多個(gè)相同的線程,在大型集群中運(yùn)行應(yīng)用程序。

圖片發(fā)自簡(jiǎn)書(shū)App

? 談機(jī)器學(xué)習(xí)總以為全是那些復(fù)雜的數(shù)學(xué)推導(dǎo)。這倒不全對(duì)。大數(shù)據(jù)有好處也有劣處。好處是海量,而壞處是冗余。你獲得的海量數(shù)據(jù)可能只用一個(gè)特征便可實(shí)現(xiàn)回歸或者聚類(lèi)。往往將數(shù)據(jù)輸入模型訓(xùn)練前,對(duì)數(shù)據(jù)的準(zhǔn)備工作要耗費(fèi)整個(gè)流程百分之八十的時(shí)間。

? 愛(ài)上數(shù)據(jù),而非學(xué)到算法。

? 在數(shù)據(jù)處理階段的硬件層次,曾多采用異構(gòu)架構(gòu)進(jìn)行算法加速。一是多核CPU.二是專(zhuān)用硬件,要么用ASIC流片,要么用FPGA設(shè)計(jì)大規(guī)模并行加速器。而在軟件層面,你用Python也好,Java也好,不過(guò)是利用架構(gòu)的接口給你提供了一個(gè)易用的框架。

圖片發(fā)自簡(jiǎn)書(shū)App

? 在統(tǒng)計(jì)學(xué)看來(lái),機(jī)器學(xué)習(xí)不過(guò)是統(tǒng)計(jì)學(xué)的應(yīng)用罷了,他們忽視了實(shí)際的工程思想,在懂業(yè)務(wù)的人看來(lái)這就是特征學(xué)習(xí)的大思想,又忽略了數(shù)理邏輯。

? 在機(jī)器學(xué)習(xí)中,贏得勝利不是因?yàn)殚_(kāi)發(fā)出了一個(gè)新算法,往往在于對(duì)數(shù)據(jù)巧妙的預(yù)處理,歸一化,以及組合現(xiàn)有方法。因?yàn)閷?shí)測(cè)表明,在數(shù)據(jù)足夠大足夠好的的情況下,最終采用不同算法的影響微乎其微。這是數(shù)據(jù)為王的思想。也是近來(lái)數(shù)據(jù)分析師崗位大熱的原因。

圖片發(fā)自簡(jiǎn)書(shū)App

? 對(duì)于我們普通人而言,在開(kāi)始學(xué)習(xí)機(jī)器學(xué)習(xí)前總是畏難,所謂困難,總是會(huì)者不難。拿數(shù)據(jù)的思想來(lái)看,我們大多數(shù)人可能很少有機(jī)會(huì)成為分子,甚至可能一生都是分母。這里要談到逆商,就是敢不敢不斷接受打擊,不斷接受不可能,不斷逆水行舟。在這個(gè)過(guò)程中會(huì)慢慢認(rèn)清自己。

? 選擇沒(méi)有錯(cuò),初心沒(méi)有錯(cuò),更重要的是不能騙自己。努力成為海量數(shù)據(jù)中那個(gè)偏差或者方差足夠大的樣本,也是很有意思的一生。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容