兩種常用的參考圖像質(zhì)量評(píng)價(jià)指標(biāo)——超分辨率(五)

兩種常用的參考圖像質(zhì)量評(píng)價(jià)指標(biāo)

  1. PSNR(Peak Signal to Noise Ratio)峰值信噪比:

峰值信噪比(PSNR)是一個(gè)表示信號(hào)最大可能功率和影響它的表示精度的破壞性噪聲功率的比值的工程術(shù)語(yǔ)。由于許多信號(hào)都有非常寬的動(dòng)態(tài)范圍,峰值信噪比常用對(duì)數(shù)分貝單位來(lái)表示。

PSNR是最普遍和使用最為廣泛的一種圖像客觀評(píng)價(jià)指標(biāo),然而它是基于對(duì)應(yīng)像素點(diǎn)間的誤差,即基于誤差敏感的圖像質(zhì)量評(píng)價(jià)。由于并未考慮到人眼的視覺(jué)特性(人眼對(duì)空間頻率較低的對(duì)比差異敏感度較高,人眼對(duì)亮度對(duì)比差異的敏感度較色度高,人眼對(duì)一個(gè)區(qū)域的感知結(jié)果會(huì)受到其周?chē)徑鼌^(qū)域的影響等),因而經(jīng)常出現(xiàn)評(píng)價(jià)結(jié)果與人的主觀感覺(jué)不一致的情況。

MSE 表示當(dāng)前圖像X和參考圖像Y的均方誤差(Mean Square Error),H、W分別為圖像的高度和寬度;
M S E=\frac{1}{H \times W} \sum_{i=1}^{H} \sum_{j=1}^{W}(X(i, j)-Y(i, j))^{2}
PSNR的單位是dB,數(shù)值越大表示失真越小。n為每像素的比特?cái)?shù),一般的灰度圖像取8,即像素灰階數(shù)為256.

P S N R=10 \log _{10}\left(\frac{\left(2^{n}-1\right)^{2}}{M S E}\right)

一般地,針對(duì) uint8 數(shù)據(jù),最大像素值為 255,;針對(duì)浮點(diǎn)型數(shù)據(jù),最大像素值為 1。

上面是針對(duì)灰度圖像的計(jì)算方法,如果是彩色圖像,通常有三種方法來(lái)計(jì)算。

  • 分別計(jì)算 RGB 三個(gè)通道的 PSNR,然后取平均值。
  • 計(jì)算 RGB 三通道的 MSE ,然后再除以 3 。
  • 將圖片轉(zhuǎn)化為 YCbCr 格式,然后只計(jì)算 Y 分量也就是亮度分量的 PSNR。
    其中,第二和第三種方法比較常見(jiàn)。
    針對(duì)超光譜圖像,我們需要針對(duì)不同波段分別計(jì)算 PSNR,然后取平均值,這個(gè)指標(biāo)稱為 MPSNR。
  1. SSIM(Structural Similarity)結(jié)構(gòu)相似性:
    \mu_{X}, \mu_{Y}分別表示圖像X和Y的均值,\sigma_{X}, \sigma_{Y}分別表示圖像X和Y的方差,\sigma_{X Y}表示圖像X和Y的協(xié)方差,即
    \mu_{X}=\frac{1}{H \times W} \sum_{i=1}^{H} \sum_{j=1}^{W} X(i, j)
    \sigma_{X}=\left(\frac{1}{H \times W-1} \sum_{i=1}^{H} \sum_{j=1}^{W}\left(X(i, j)-\mu_{X}\right)^{2}\right)^{\frac{1}{2}}
    \sigma_{X Y}=\frac{1}{H \times W-1} \sum_{i=1}^{H} \sum_{j=1}^{W}\left(X(i, j)-\mu_{X}\right)\left(Y(i, j)-\mu_{Y}\right)

SSIM分別從 亮度、對(duì)比度、結(jié)構(gòu) 三方面度量圖像相似性。
l(X, Y)=\frac{2 \mu_{X} \mu_{Y}+C_{1}}{\mu_{X}^{2}+\mu_{Y}^{2}+C_{1}}

c(X, Y)=\frac{2 \sigma_{X} \sigma_{Y}+C_{2}}{\sigma_{X}^{2}+\sigma_{Y}^{2}+C_{2}}

s(X, Y)=\frac{\sigma_{X Y}+C_{3}}{\sigma_{X} \sigma_{Y}+C_{3}}

C_{1}, C_{2}, C_{3}為常數(shù),為了避免分母為0的情況,通常取C 1=(K 1 * L)^{2}, C 2=(K 2 * L)^{2}, C 3=\frac{C_{2}}{2}, 一般地K1=0.01, K2=0.03, L=255. 則
\operatorname{SSIM}(X, Y)=l(X, Y) * c(X, Y) * s(X, Y)

SSIM取值范圍[0,1],值越大,表示圖像失真越小.
SSIM的特殊形式如下:

S S I M(X, Y)=\frac{\left(2 \mu_{X} \mu_{Y}+C_{1}\right)\left(2 \sigma_{X Y}+C_{2}\right)}{\left(\mu_{X}^{2}+\mu_{Y}^{2}+C_{1}\right)\left(\sigma_{X}^{2}+\sigma_{Y}^{2}+C_{2}\right)}

MSSIM(Mean Structural Similarity )平均結(jié)構(gòu)相似性
在實(shí)際應(yīng)用中,可以利用滑動(dòng)窗將圖像分塊,令分塊總數(shù)為N,考慮到窗口形狀對(duì)分塊的影響,采用加權(quán)計(jì)算每一窗口的均值、方差以及協(xié)方差,權(quán)值w_{i j}滿足\sum_{i} \sum_{j} w_{i j}=1,通常采用高斯核,然后計(jì)算對(duì)應(yīng)塊的結(jié)構(gòu)相似度SSIM,最后將平均值作為兩圖像的結(jié)構(gòu)相似性度量,即平均結(jié)構(gòu)相似性MSSIM:
\mu_{X}=\sum_{i=1}^{H} \sum_{j=1}^{W} w_{i j} X(i, j)

\sigma_{X}=\left(\sum_{i=1}^{H} \sum_{j=1}^{W} w_{i j}\left(X(i, j)-\mu_{X}\right)\right)^{\frac{1}{2}}

\sigma_{X Y}=\sum_{i=1}^{H} \sum_{j=1}^{W} w_{i j}\left(X(i, j)-\mu_{X}\right)\left(Y(i, j)-\mu_{Y}\right)

\operatorname{MSSIM}=\frac{1}{N} \sum_{k=1}^{N} \operatorname{SSIM}\left(x_{k}, y_{k}\right)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容