VOC2007數(shù)據(jù)集制作與訓(xùn)練自己的數(shù)據(jù)

1. VOC2007數(shù)據(jù)集的格式

JPEGImages文件夾:該文件夾里包含了訓(xùn)練用的圖像以及測(cè)試用的圖像,混合存放在一起;

Annatations文件夾:該文件夾存放xml格式的標(biāo)簽文件,每個(gè)xml文件都對(duì)應(yīng)于一張JPEGImages文件夾中的圖像;

ImageSets文件夾:Action文件夾:存放的是人的動(dòng)作,可以暫時(shí)不用;Layout存放的是人體部位的數(shù)據(jù),可以暫時(shí)不用;Main存放的是圖像物體識(shí)別的數(shù)據(jù),可詳見下面的解釋;Segmentation:存放可用于分割的數(shù)據(jù);

其他文件夾:其他分割用途


2. 數(shù)據(jù)的制作

1)將所有圖像文件命名為000001.jpg格式的文件名,并存放到JPGEImages文件夾中;其實(shí),文件名不一定非要從000001開始往下排,文件名的長(zhǎng)度也可以不一樣;

2)使用LabelImiage軟件,將圖像做標(biāo)記,并生成相應(yīng)的xml文件,將所有的標(biāo)記xml文件存放到Annatations文件夾中;注意xml文件的文件名一定要與jpg圖像文件名相一致;

3)利用python代碼向ImageSets中Main文件夾中寫入數(shù)據(jù):trainval.txt;test.txt;train.txt;val.txt

其中,txt文件中的信息為圖像的名字,無(wú)后綴無(wú)空格;

test.txt是測(cè)試集;train.txt是訓(xùn)練集;val.txt是驗(yàn)證集;trainval.txt是訓(xùn)練和驗(yàn)證集

VOC2007中,trainval大概是整個(gè)數(shù)據(jù)集的50%,test也大概是整個(gè)數(shù)據(jù)集的50%;train大概是trainval的50%,val大概是trainval的50%

3. 訓(xùn)練自己的數(shù)據(jù)

在制作好以上格式的數(shù)據(jù)之后,需要對(duì)代碼進(jìn)行修改才可以讓Faster R-CNN學(xué)習(xí)自己的數(shù)據(jù)并進(jìn)行識(shí)別。

修改為:pascal_voc.py文件 class pascal_voc中,__init__函數(shù)的self._classes;將自己的類別添加進(jìn)去,并刪除原有的VOC類別。這里,程序會(huì)根據(jù)classes的keyValue個(gè)數(shù)自動(dòng)設(shè)置classes的數(shù)目:num_classes,所以其他地方不需要修改;如果想修改讀取數(shù)據(jù)的路徑等,可以修改self._devkit_path以及self._data_path,另外還有一處文件路徑需要修改,暫時(shí)忘了要在哪里改了(下次Debug的時(shí)候再補(bǔ)充)

修改完成后,一定要?jiǎng)h除data文件夾中的cache緩存文件,否則會(huì)出現(xiàn)imread錯(cuò)誤等現(xiàn)象的發(fā)生

完成以上工作之后,在終端中運(yùn)行python train.py,就可以執(zhí)行訓(xùn)練程序了,在執(zhí)行訓(xùn)練程序的時(shí)候,有很多斷點(diǎn)等莫名的問題出現(xiàn),此時(shí)需要考慮自己的數(shù)據(jù)中目標(biāo)物的尺度、圖像的尺度等是否符合Faster RCNN的默認(rèn)條件,如果不符合,則需要在config.py中對(duì)RPN相關(guān)參數(shù)進(jìn)行適當(dāng)?shù)男薷?,另外還要注意layer_utils文件夾中的nets/network.py中261行的create_architecture中所定義的輸入?yún)?shù)achor_scales以及achor_ratios的設(shè)置。具體每個(gè)參數(shù)的解釋需要詳細(xì)的研究。

不管怎樣,首先開始訓(xùn)練吧

參考:http://blog.csdn.net/gaohuazhao/article/details/60871886

批量修改文件夾JPEGImages中圖片的名字:

http://blog.csdn.net/gaohuazhao/article/details/60324715

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容