周五去計(jì)算所面談,被得知是打ACM的就沒有被問任何傳統(tǒng)概念上的算法,倒是盯著簡歷被問了一堆曾經(jīng)做過的模式識別相關(guān)的內(nèi)容。經(jīng)典模型的原理對答如流,唯獨(dú)最經(jīng)典的三種目標(biāo)檢測特征:hog、lbp、haar中的haar我是一點(diǎn)都沒有看過的(偷懶了),于是似乎被鄙視了一下?
最終的結(jié)果,老師對我很滿意,我對老師也很滿意(???),直接被安利了一坨實(shí)驗(yàn)室項(xiàng)目,以及問要不要直接來做畢設(shè)。
劉老師所在的實(shí)驗(yàn)室是泛在計(jì)算系統(tǒng)研究中心,是去年1月份新合并的實(shí)驗(yàn)室,研究方向有很多,劉老師研究的方向大致就是計(jì)算機(jī)視覺和模式識別,曾經(jīng)做過一些針對性比較強(qiáng)的課題,在官網(wǎng)上看到她十年前就發(fā)過好幾篇頂會,但是隨后就不再更新了,只是當(dāng)面聊才得知最近因?yàn)樯疃葘W(xué)習(xí)很火于是他們也開始做這方面的研究了。
在計(jì)算所的樓里轉(zhuǎn)了轉(zhuǎn),感覺不錯(cuò),很像一個(gè)大廠。聽LZG說網(wǎng)特別爛,上百度要6s,叫我做好準(zhǔn)備,我:emmmm…
回學(xué)校頹了一晚上,第二天開始找haar的資料,準(zhǔn)備補(bǔ)一下這個(gè)。于是就翻到了龍女士(???)的這篇碩士論文
基于Adaboost的人臉檢測方法及眼睛定位算法研究 龍伶敏 電子科技大學(xué)
本來只是想擼一下haar特征的,但是感覺一般畢業(yè)論文都會把研究路徑寫得比較詳細(xì)(比期刊高到不知道哪里去了),于是順便讀完了整本。
補(bǔ)了一些姿勢:
haar特征:定義模板,模板有兩部分,用模板按比例放縮對圖像進(jìn)行分兩部分求和再作差,主要用了一個(gè)矩陣前綴和優(yōu)化,是個(gè)非常簡單的dp,我覺得其實(shí)可以用二維樹狀數(shù)組來替代這個(gè)預(yù)處理,但是優(yōu)勢僅能在顏色分布比較單一的條件下才有效。由于圖像有可能非常大,所以還需要類似水平或者垂直深度直方圖之類的手段進(jìn)行粗定位,之后在定位的范圍內(nèi)使用haar特征,這具體實(shí)現(xiàn)要分析檢測目標(biāo)的色彩深度特點(diǎn)。
PAC(概率近似正確框架):從合理數(shù)量的訓(xùn)練數(shù)據(jù)中通過合理的計(jì)算量可靠的學(xué)習(xí)到知識,使得保證假設(shè)是有一定概率為正確的一種設(shè)計(jì)分類器的思路。
Boost&AdaBoost算法:將弱學(xué)習(xí)分類器通過某種(比如級聯(lián))方式結(jié)合起來,構(gòu)造成強(qiáng)分類器的一種分類算法。
瀑布(Cascade)算法:基于AdaBoost算法的強(qiáng)分類算法。
隱馬爾科夫模型:似乎在cv上很少用,還有什么躍遷矩陣。算了,我連馬爾科夫鏈?zhǔn)鞘裁炊疾恢?,這個(gè)棄了。
這篇論文讀完可以說是收獲很多,除了haar特征以外,還學(xué)到了不少圖形學(xué)方面的知識,以及做研究和寫論文的思路。
這篇論文其實(shí)還是有很多細(xì)節(jié)處理得比較粗糙的,比如論文第39頁設(shè)置窗口放大系數(shù)為1.2的時(shí)候并沒有闡述原因,只是隨口一提。39、40頁提到多ROI區(qū)域合并的時(shí)候簡單使用坐標(biāo)的幾何中心以及區(qū)域邊長均值做合并后的ROI,諸如此類。
以及自己的一些想法:文章里提到過一個(gè)利用離散對稱變換的方法定位一個(gè)對稱特征(比如眼睛),其實(shí)我覺得這里可以把對稱思想應(yīng)用到直方圖中,做一側(cè)的對稱采樣點(diǎn),求差的絕對值最小,認(rèn)為是對稱。