凸面鏡反射場(chǎng)景無(wú)監(jiān)督域適應(yīng)語(yǔ)義分割的一些問題
大家好,我是來(lái)自北京大學(xué)的石永杰同學(xué),最近我們組的工作《Unsupervised Domain Adaptation for Semantic Segmentation of Urban Street Scenes Reflected by Convex Mirrors》
被IEEE Transactions on Intelligent Transportation Systems (T-ITS)接收,傳送門https://ieeexplore.ieee.org/document/9903282
在做這個(gè)工作的時(shí)候,遇到了一些問題,第一個(gè)問題是為什么需要UDA來(lái)解決這個(gè)問題?第二個(gè)問題是(包括審稿人也在問):“凸面鏡作為光學(xué)成像里的一個(gè)基本器件,在光學(xué)設(shè)計(jì)領(lǐng)域已經(jīng)被充分地研究,并且有精確地物理建模,為什么要將凸面鏡成像的畸變分解為徑向畸變和透視畸變?”
這里要從無(wú)監(jiān)督域適應(yīng)(UDA)和針相機(jī)模型以及凸面鏡的成像規(guī)律說起。
關(guān)鍵詞
凸面鏡 語(yǔ)義分割 徑向畸變 畸變 無(wú)監(jiān)督域適應(yīng) 北京大學(xué)
無(wú)監(jiān)督域適應(yīng)
域適應(yīng)(Domain Adaptation)技術(shù)主要是解決分類器在測(cè)試的時(shí)候有偏差的問題,如下圖所示
[圖片上傳失敗...(image-f54ec3-1666185319052)]
域適應(yīng)技術(shù)分為三種setting,分別是全監(jiān)督域適應(yīng),半監(jiān)督域適應(yīng)以及無(wú)監(jiān)督域適應(yīng)。全監(jiān)督域適應(yīng)要求目標(biāo)域所有的樣本都具有標(biāo)簽,半監(jiān)督則要求目標(biāo)域數(shù)據(jù)有部分標(biāo)簽。對(duì)于不同的任務(wù)往往需要不同的設(shè)定,對(duì)圖像分類任務(wù)而言,每張圖像給打一個(gè)標(biāo)簽,標(biāo)注的任務(wù)相對(duì)而言不是那么地繁重。但是對(duì)于語(yǔ)義分割任務(wù)則不同,Cityscapes數(shù)據(jù)集報(bào)告說每張Cityscapes里面的圖像需要1.5小時(shí)的標(biāo)注時(shí)間,成本可謂非常之高,因此對(duì)于無(wú)監(jiān)督域適應(yīng)而言,如果有大量的現(xiàn)成的圖像(源域圖像),和大量的目標(biāo)域無(wú)標(biāo)記的圖像,就能夠提升模型在目標(biāo)域的性能,這將會(huì)極大減少分割任務(wù)標(biāo)注的壓力。
對(duì)于凸面鏡這種新場(chǎng)景而言,如果用監(jiān)督學(xué)習(xí)的方式進(jìn)行訓(xùn)練,則需要大量的標(biāo)記數(shù)據(jù),這顯然不太現(xiàn)實(shí)。在數(shù)據(jù)采集的過程中,我們?cè)诒本┐髮W(xué)校園內(nèi)采集,使用的是三腳架以及買的一些凸面鏡,北大的師弟幫忙拍攝采集;在標(biāo)注的過程也是,北京大學(xué)的師弟幫忙標(biāo)注,算了一下,每個(gè)人標(biāo)注一張數(shù)據(jù),復(fù)雜的可能要花三個(gè)小時(shí),簡(jiǎn)單的至少也要一個(gè)小時(shí),工作量可見之大。
這也是為啥我們決定用無(wú)監(jiān)督域適應(yīng)這種方法來(lái)提升凸面鏡反射場(chǎng)景的分割精度。
針孔相機(jī)模型
針孔相機(jī)模型是計(jì)算機(jī)視覺的基礎(chǔ),針孔相機(jī)模型的理論基礎(chǔ)是小孔成像,如下圖所示
[圖片上傳失敗...(image-fae35f-1666185319052)]
如果已知焦距和物距,實(shí)際上可以算出成像平面上的物體大小。
現(xiàn)有的很多公開數(shù)據(jù)集都已經(jīng)是標(biāo)定之后的圖像或者是徑向畸變程度很小的圖像,讀者拿到的圖像都符合或者是幾乎接近針孔相機(jī)模型所成的圖像的,如果想用針孔相機(jī)模型下拍攝到的圖像用來(lái)模擬鏡面反射的圖像,需要鏡面反射的過程能夠保持單光心的性質(zhì),即空間中一點(diǎn)發(fā)射的光線經(jīng)過鏡面反射之后,其反向延長(zhǎng)線同樣地相交于一點(diǎn)。這對(duì)于平面鏡是顯然的,對(duì)于凸面鏡卻不是這樣(這里僅以常見的球面鏡為例)。
凸面鏡成像
[圖片上傳失敗...(image-3edfbf-1666185319052)]
對(duì)平面鏡而言,空間中的一點(diǎn)發(fā)出的光線經(jīng)過反射,其反向延長(zhǎng)線相交于一點(diǎn)
,這里給出簡(jiǎn)單的證明。根據(jù)反射定理,可以得到
,而
又垂直于
,則
與
全等,因此有
,同樣可以證明在三角形
與
全等。所以他們相交于
這一點(diǎn)。
但是對(duì)于凸面鏡卻不是這樣。假設(shè)凸面鏡表面的形狀為球面,空間中的一點(diǎn)距離凸面鏡球心
的距離為
,球面凸面鏡的半徑為
,如上圖所示。從
點(diǎn)發(fā)出的入射光線沿著
角入射到球面凸面鏡上,入射點(diǎn)為
,反向延長(zhǎng)反射光線,與光軸相交于
。如果凸面鏡能夠保持入射光束的單光心性,則同一位置不同光線(
角不同)經(jīng)過凸面鏡反射后,其反向延長(zhǎng)線理應(yīng)匯聚于
點(diǎn),否則,凸面鏡不能夠保持入射光束的單光心性。假設(shè)入射角與出射角為
,由于入射角與出射角相同,并且出射角與
互為對(duì)頂角,因此
。
根據(jù)正弦定理,對(duì)有:
同時(shí)入射角為
中
的外角,因此有
,
,則可求出
。對(duì)
有:
結(jié)合上面兩個(gè)式子,可以得到
在上式中,為常數(shù)。根據(jù)式1,
可用
表示,并且
不可化為常數(shù),因此
與入射角
密切相關(guān),即凸面鏡反射并不能保持入射光束的單光心性質(zhì)。由相機(jī)模型是假設(shè)空間中的入射光線經(jīng)過小孔投射到成像平面,而凸面鏡并不能保持入射光束的單光心性,因此無(wú)法利用現(xiàn)有的正常圖像來(lái)嚴(yán)格模擬凸面鏡反射圖像,這也是為什么無(wú)法用現(xiàn)有的Cityscapes等語(yǔ)義分割數(shù)據(jù)集來(lái)嚴(yán)格模擬凸面鏡成像的原因。
總結(jié)
面向新場(chǎng)景時(shí),因?yàn)闃?biāo)注工作量大,所以需要UDA。而利用現(xiàn)有的針孔相機(jī)模型拍攝的圖像無(wú)法嚴(yán)格模擬凸面鏡反射圖像,因此我們從直觀上將凸面鏡產(chǎn)生的形變分解為徑向畸變還有透視畸變,以此來(lái)模擬凸面鏡產(chǎn)生的變形,提升分割模型在目標(biāo)域的表現(xiàn)性能。