8.5 YOLO V2
YOLO V2相比V1的改進部分有:
- 大尺度預(yù)訓(xùn)練分類
- 新網(wǎng)絡(luò):Darknet-19
- 加入anchor

圖1 YOLO V2和V1的比較
下面分別介紹YOLO V2的重要特征
- Batch Normalization。使用批量歸一化,去除dropout,提高模型的泛化能力。通過增加BN層,提高了2點mAP。
- 使用大尺寸圖片
來微調(diào)VGG或resnet網(wǎng)絡(luò),然后使用微調(diào)后的網(wǎng)絡(luò)進行特征提取。
- 帶錨框的卷積層。去掉了全連接層,使用卷積層。
- 維度聚類。先對標(biāo)簽做了聚類分析,根據(jù)聚類分析的結(jié)果,使用聚類分析的先驗框來預(yù)測。
-
新網(wǎng)絡(luò)(Darknet-19)。圖2 darknet-19
-
直接位置預(yù)測。圖3 位置預(yù)測
- Fine-Grained Features。
- Multi-Scale Training。每隔一定數(shù)量的epochs之后,改變輸入圖像尺寸。32的倍數(shù){320,352,…,608}。
YOLO V2的訓(xùn)練
- 第一階段:先在ImageNet分類數(shù)據(jù)集上預(yù)訓(xùn)練Darknet-19,此時模型輸入為
,共訓(xùn)練160個epochs。
- 第二階段:將網(wǎng)絡(luò)的輸入調(diào)整為
,繼續(xù)在ImageNet數(shù)據(jù)集上finetune分類模型,訓(xùn)練10個epochs,此時分類模型的top-1準(zhǔn)確度為76.5%,而top-5準(zhǔn)確度為93.3%。
- 第三個階段:修改Darknet-19分類模型為檢測模型,并在檢測數(shù)據(jù)集上繼續(xù)finetune網(wǎng)絡(luò)。 網(wǎng)絡(luò)修改包括(網(wǎng)路結(jié)構(gòu)可視化):移除最后一個卷積層、global avgpooling層以及softmax層,并且新增了三個
卷積層,同時增加了一個passt hrough層,最后使用
卷積層輸出預(yù)測結(jié)果。

