數(shù)字圖像處理(劉定生版)——第一節(jié) 數(shù)字圖像處理導論

本系列隨筆將以中科院劉定生老師的視頻教程為依托,全面講解自己在學習過程中的理解與實踐,爭取一遍拿下數(shù)字圖像處理。希望能與有緣的讀者共勉。

什么是圖像
  • ""是物體投射或反射光的分布,“”是人的視覺系統(tǒng)對圖的接受在大腦中形成的印象或者反映。
  • “一幅圖像是一個東西的另一個表示”,是其所表示物體的信息的一個濃縮和高度概括
  • 是客觀和主觀的結合
  • 圖像是對客觀存在的物體的一種相似性的生動模仿或描述。是物體的一種不完全、不精確,但在某種意義上是適當?shù)谋硎尽?/li>
圖像的分類

圖像的分類.png

注釋:其中的光圖像主要指通過光源產(chǎn)生的一些圖像,例如投影儀、燈光等;不可見的物理圖像主要指代通過不可見光源產(chǎn)生的圖像,例如:CT、B超等;數(shù)學函數(shù)主要是通過數(shù)學函數(shù)例如波形圖產(chǎn)生的圖像(模擬圖像等)。

模擬圖像

物理上為了將圖像進行進行展示一般通過圖像的模擬信號進行圖象的展示,模擬圖象通過函數(shù):I=f(x,y,z,λ,t)或者I=f(x,y)的方式進行圖象重構,其中,I表示亮度(灰度),x,y,z表示三維坐標系中的坐標,λ表示波長,t表示時間。

模擬圖像一般由以下一些特點:

  • 三維空間連續(xù)
  • 時間上連續(xù)(多指影視圖像)
  • 波普上連續(xù)(灰度連續(xù)變化)
  • 不可見物理圖像(多指CT、MRI等通過不可見光產(chǎn)生的圖像)
  • 想象中的虛擬圖像

這些東西還不是很具體,通過查閱資料,對虛擬圖像進行了補充:

  • 百度百科來源
    模擬圖像:又稱連續(xù)圖像,是指在二維坐標系中連續(xù)變化的圖像,即圖像的像點是無限稠密的,同時具有灰度值(即圖像從暗到亮的變化值)。連續(xù)圖像的典型代表是由光學透鏡系統(tǒng)獲取的圖像,如人物照片和景物照片等,有時又稱模擬圖像。
    數(shù)字圖像:計算機的圖象是以數(shù)字的方式存儲與工作的,它把圖像按行與列分割成m×n個網(wǎng)格,然后每個網(wǎng)格的圖像表示為該網(wǎng)格的顏色平均值的一個像素,亦即用一個m×n的像素矩陣來表達一幅圖像,m與n稱為圖像的分辨率.顯然分辨率越高,圖像失真越小.也是因為計算機中只能用有限長度的二進制位來表示顏色的緣故,每個像素點的顏色只能是所有可表達的顏色中的一種,這個過程稱為圖像顏色的離散化.顏色數(shù)越多,用以表示顏色的位數(shù)越長,圖像顏色就越逼真.
    模擬圖像簡介:以計算機斷層掃描技術為基礎發(fā)展起來的X-CT,MRI,PET和SPECT等是對X射線或其它激發(fā)源激發(fā)出來帶有體內(nèi)信息的信號(投影)進行數(shù)字化圖像信息采集和處理,用投影-卷積-反投影方法根據(jù)投影數(shù)據(jù)單準則或多準則來重構的圖像.由于這類斷層掃描成像系統(tǒng)的主機存儲容量有限,最終仍然要以膠片等硬拷貝來載帶并儲存重構的模擬圖像.因此這類醫(yī)學圖像成像技術一般稱之為本質(zhì)上的模擬圖像技術.
    模擬圖像的采集:由于目前的計算機只能處理數(shù)字信息,我們得到的照片、圖紙等原始信息都是連續(xù)的模擬信號,必須將連續(xù)的圖像信息轉(zhuǎn)化為數(shù)字形式??梢园褕D像看作是一個連續(xù)變化的函數(shù),圖像上各點的灰度是所在位置的函數(shù),這就要經(jīng)過數(shù)字化的采樣與量化。下面簡單介紹圖像數(shù)字化采樣的方法。
    對連續(xù)圖像f(x,y)進行等間隔采樣,在(x,y)平面上,將圖像分成均勻的小網(wǎng)格,每個小網(wǎng)格的位置可以用整數(shù)坐標表示,這樣采樣值就對應了這個位置上網(wǎng)格的灰度值。若采樣結果每行像素為M個,每列像素為N個,則整幅圖像對應于一個M x N 數(shù)字矩陣,這樣就獲得了數(shù)字圖像中關于像素的兩個屬性:位置和灰度。
  • 豆丁網(wǎng)來源
    數(shù)字圖像與模擬圖像的區(qū)別:現(xiàn)實中的圖像是一個二維函數(shù),可用I(x, y) 來表示,其中(x, y) 表示位置信息,
    I表示亮度信息,亮度的取值范圍是是實數(shù)集。用舊式的膠片照相機,磁帶攝像機等得到的圖像是模擬圖象,模擬圖像所在的空間是連續(xù)空間。因為計算機只能處理可進行二進制轉(zhuǎn)化的數(shù)據(jù),所以計算機不能直接處理模擬圖像。為了在計算機上處理圖像,不得不對圖像進行量化,這樣就出現(xiàn)了數(shù)字圖像,其實數(shù)字圖像是模擬圖像的量化,數(shù)字圖像所在的空間是離散的。圖1.1顯示了模擬信號與數(shù)字信號的不同?,F(xiàn)在流行的數(shù)碼相機拍攝的圖像是數(shù)字圖像,可以被計算機處理。圖1.2 比較了模擬圖像和數(shù)字圖像。
    圖1.1 模擬信號與數(shù)字信號.png

    圖1.2模擬圖像與數(shù)字圖像.png

看完以上的兩個來源的內(nèi)容相信對于數(shù)字圖像和模擬圖象已經(jīng)有了清晰的認識,我們繼續(xù)課程流程。

形成數(shù)字圖像的基本過程
成像過程.png

其中A/D轉(zhuǎn)換為模數(shù)轉(zhuǎn)換,將模擬信號轉(zhuǎn)換為數(shù)字信號。

數(shù)字圖像的表示---------二位矩陣

將圖像劃分為m*n的矩陣,每個足夠小,每個矩陣都有自己對應的坐標x,y,每個像素值,是該位置內(nèi)灰度值的平均值,大致圖示如下:


數(shù)字圖像的展示.png
數(shù)字圖像的基本要素------像素

如圖1.2所示,一副圖像可分成m×n 個小的網(wǎng)格,我們也可以說這是一幅m×n大小的圖像。模擬圖像一個網(wǎng)格中可以有亮的部分,也可以有暗的部分,但是數(shù)字圖像單一網(wǎng)格內(nèi)的亮度值必須是固定的,這個網(wǎng)格就叫做像素。像素是數(shù)字圖像的基本單元。比如我們常說的100×100的分辨率,表示一共有10000個像素點填充了一個行列都為100的矩陣。如果每一個像素只有一個亮度值,那么這幅圖像又稱為灰度圖,而像素的亮度又稱為灰度,表1.1給出了一般圖像的像素數(shù)大小和灰度值的取值。當灰度取值只有2個的情況下,該圖像稱為二值化圖像,灰度的值不是0就是1。一般灰度圖像素的取值范圍為[0,255]。像素多的數(shù)字圖像看起來和模擬圖像差不多,但是當你將圖像放大的時候就可以看到一個個小的網(wǎng)格,也就是像素。如果一個像素的亮度有幾個值構成,該圖像則為彩色圖像。一般的彩色圖像有3個亮度值,分別稱為R(紅色素),G(綠色素),和B(藍色素)。

表1.1 一般圖像的像素大小和灰度值的取值范圍.png

具體效果展示如下:
像素.png

談到這里就不免會有一些疑惑,你可能會對像素的像素坐標系有些許疑惑,對于這方面的問題,我通過查閱博客對相機成像原理進行了了解:以下內(nèi)容轉(zhuǎn)載自:計算機視覺:相機成像原理:世界坐標系、相機坐標系、圖像坐標系、像素坐標系之間的轉(zhuǎn)換,也可參考世界坐標系和像素坐標系,圖像坐標系的關系
本部分內(nèi)容主要講解像素的坐標表示以及相機的成像原理,即各種坐標系的坐標轉(zhuǎn)換。

1.正文

圖像處理、立體視覺等等方向常常涉及到四個坐標系:世界坐標系、相機坐標系、圖像坐標系、像素坐標系。例如下圖:


這里寫圖片描述

構建世界坐標系只是為了更好的描述相機的位置在哪里,在雙目視覺中一般將世界坐標系原點定在左相機或者右相機或者二者X軸方向的中點。
接下來的重點,就是關于這幾個坐標系的轉(zhuǎn)換。也就是說,一個現(xiàn)實中的物體是如何在圖像中成像的。

1.1世界坐標系與相機坐標系
這里寫圖片描述

于是,從世界坐標系到相機坐標系,涉及到旋轉(zhuǎn)和平移(其實所有的運動也可以用旋轉(zhuǎn)矩陣和平移向量來描述)。繞著不同的坐標軸旋轉(zhuǎn)不同的角度,得到相應的旋轉(zhuǎn)矩陣,如下圖所示:


這里寫圖片描述

那么從世界坐標系到相機坐標系的轉(zhuǎn)換關系如下所示:


這里寫圖片描述
1.2相機坐標系與圖像坐標系

從相機坐標系到圖像坐標系,屬于透視投影關系,從3D轉(zhuǎn)換到2D。


這里寫圖片描述

此時投影點p的單位還是mm,并不是pixel,需要進一步轉(zhuǎn)換到像素坐標系。

1.3圖像坐標系與像素坐標系

像素坐標系和圖像坐標系都在成像平面上,只是各自的原點和度量單位不一樣。圖像坐標系的原點為相機光軸與成像平面的交點,通常情況下是成像平面的中點或者叫principal point。圖像坐標系的單位是mm,屬于物理單位,而像素坐標系的單位是pixel,我們平常描述一個像素點都是幾行幾列。所以這二者之間的轉(zhuǎn)換如下:其中dx和dy表示每一列和每一行分別代表多少mm,即1pixel=dx mm


這里寫圖片描述

那么通過上面四個坐標系的轉(zhuǎn)換就可以得到一個點從世界坐標系如何轉(zhuǎn)換到像素坐標系的。


這里寫圖片描述

其中相機的內(nèi)參和外參可以通過張正友標定獲取這里查看張正友標定的資料。通過最終的轉(zhuǎn)換關系來看,一個三維中的坐標點,的確可以在圖像中找到一個對應的像素點,但是反過來,通過圖像中的一個點找到它在三維中對應的點就很成了一個問題,因為我們并不知道等式左邊的Zc的值。

最后在強調(diào)一下,像素坐標系中的像素坐標是按照行列的方式進行標定的,像素灰度值為該像素區(qū)域內(nèi)灰度平均值:


像素坐標系.png
數(shù)字圖像的基本要素------像素值

像素值:對單個像素灰度值進行數(shù)字化采樣,即一個像素值用多少位表示,位數(shù)越多說明表示的色彩范圍越大,圖像對比度也就越大,圖像色彩(灰度)信息更豐富。

image.png
image.png
數(shù)字圖像的基本要素------圖像大?。ㄏ袼刂凳菆D像中的最小單位)

圖像尺寸:數(shù)字圖像矩陣的大小

數(shù)字圖像處理與分析概述
  • 概述.png
  • 數(shù)字圖像處理實質(zhì).png
  • 研究內(nèi)容(一).png

    研究內(nèi)容(二).png
數(shù)字圖像處理與分析的哲學觀點
  • 連續(xù)與離散
    物理圖像——時、空與輻射強度均連續(xù)的自然物體的表示——I=f(x,y,z,λ,t),物理圖像也即模擬圖像
    數(shù)字圖像——物理圖像某一時刻二維空間離散采樣點的集合——I=f[x,y]
  • 表示與處理
    物理圖像——可用連續(xù)函數(shù)進行較好地描述、分析與處理
    數(shù)字圖像——時空與幅度均為離散的數(shù)據(jù)矩陣,常借助連續(xù)函數(shù)的分析結果與處理方法進行離散處理
信息與通訊理論(香農(nóng))

圖像處理理論將通信理論中的一維問題推廣到二維空間。通信理論研究一維空間的信息,圖像理論則研究二維空間的信息。

  • 通信理論——研究時間域和頻率域的問題
  • 圖像理論——研究空間域和空間頻率域(或變換域)的問題
  • 通信理論認為——任何一個隨時間變化的波形都是由許多頻率不同、振幅不同的正玄波組合而成
  • 圖像理論認為——任何一副平面圖像是由許多頻率不同、振幅不同的X-Y方向的空間頻率波疊加而成,高空間頻率波決定圖像的細節(jié),低空間頻率波決定圖像的背景和動態(tài)范圍。

歡迎關注我的個人微信公眾號,免費送計算機各種最新視頻資源!你想象不到的精彩!


0.jpg
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容