深度學(xué)習(xí)知識點匯總-目標(biāo)檢測(5)

8.5 YOLO V2

YOLO V2相比V1的改進部分有:

  1. 大尺度預(yù)訓(xùn)練分類
  2. 新網(wǎng)絡(luò):Darknet-19
  3. 加入anchor
圖1 YOLO V2和V1的比較

下面分別介紹YOLO V2的重要特征

  • Batch Normalization。使用批量歸一化,去除dropout,提高模型的泛化能力。通過增加BN層,提高了2點mAP。
  • 使用大尺寸圖片448 \times 448來微調(diào)VGG或resnet網(wǎng)絡(luò),然后使用微調(diào)后的網(wǎng)絡(luò)進行特征提取。
  • 帶錨框的卷積層。去掉了全連接層,使用卷積層。
  • 維度聚類。先對標(biāo)簽做了聚類分析,根據(jù)聚類分析的結(jié)果,使用聚類分析的先驗框來預(yù)測。
  • 新網(wǎng)絡(luò)(Darknet-19)。
    圖2 darknet-19
  • 直接位置預(yù)測。
    圖3 位置預(yù)測
  • Fine-Grained Features。
  • Multi-Scale Training。每隔一定數(shù)量的epochs之后,改變輸入圖像尺寸。32的倍數(shù){320,352,…,608}。

YOLO V2的訓(xùn)練

  • 第一階段:先在ImageNet分類數(shù)據(jù)集上預(yù)訓(xùn)練Darknet-19,此時模型輸入為224\times 224,共訓(xùn)練160個epochs。
  • 第二階段:將網(wǎng)絡(luò)的輸入調(diào)整為448\times 448,繼續(xù)在ImageNet數(shù)據(jù)集上finetune分類模型,訓(xùn)練10個epochs,此時分類模型的top-1準(zhǔn)確度為76.5%,而top-5準(zhǔn)確度為93.3%。
  • 第三個階段:修改Darknet-19分類模型為檢測模型,并在檢測數(shù)據(jù)集上繼續(xù)finetune網(wǎng)絡(luò)。 網(wǎng)絡(luò)修改包括(網(wǎng)路結(jié)構(gòu)可視化):移除最后一個卷積層、global avgpooling層以及softmax層,并且新增了三個3\times 3 \times 2014卷積層,同時增加了一個passt hrough層,最后使用1\times 1卷積層輸出預(yù)測結(jié)果。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容