圖像處理基本知識圖像處理的方法
圖像處理基本知識圖像處理的方法
圖像處理又稱為影像處理,是用計算機對圖像進行達到所需結果的技術。那么你對圖像處理了解多少呢?以下是由學習啦小編整理關于圖像處理基本知識的內容,希望大家喜歡!
圖像處理的介紹
所謂數(shù)字圖像處理就是利用計算機對圖像信息進行加工以滿足人的視覺心理或者應用需求的行為。實質上是一段能夠被計算機還原顯示和輸出為一幅圖像的數(shù)字碼。 21世紀是一個充滿信息的時代,圖像作為人類感知世界的視覺基礎,是人類獲取信息、表達信息和傳遞信息的重要手段。
數(shù)字圖像處理即用計算機對圖像進行處理,其發(fā)展歷史并不長。數(shù)字圖像處理技術源于20世紀20年代,當時通過海底電纜從英國倫敦到美國紐約傳輸了一幅照片,采用了數(shù)字壓縮技術。
首先數(shù)字圖像處理技術可以幫助人們更客觀、準確地認識世界,人的視覺系統(tǒng)可以幫助人類從外界獲取3/4以上的信息,而圖像、圖形又是所有視覺信息的載體,盡管人眼的鑒別力很高,可以識別上千種顏色,但很多情況下,圖像對于人眼來說是模糊的甚至是不可見的,通過圖象增強技術,可以使模糊甚至不可見的圖像變得清晰明亮。
另一方面,通過數(shù)字圖像處理中的模式識別技術,可以將人眼無法識別的圖像進行分類處理。通過計算機模式識別技術可以快速準確地檢索、匹配和識別出各種東西。
數(shù)字圖像處理技術已經(jīng)廣泛深入地應用于國計民生休戚相關的各個領域。
在計算機中,按照顏色和灰度的多少可以將圖像分為二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。大多數(shù)圖像處理軟件都支持這四種類型的圖像。
中國物聯(lián)網(wǎng)校企聯(lián)盟認為圖像處理將會是物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的重要支柱之一,它的具體應用是指紋識別技術。
二值圖像
一幅二值圖像的二維矩陣僅由0、1兩個值構成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有0、1兩種可能,所以計算機中二值圖像的數(shù)據(jù)類型通常為1個二進制位。二值圖像通常用于文字、線條圖的掃描識別(OCR)和掩膜圖像的存儲。
灰度圖像
灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為8位無符號整數(shù)的(int8),這就是人們經(jīng)常提到的256灰度圖像。“0”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色。在某些軟件中,灰度圖像也可以用雙精度數(shù)據(jù)類型(double)表示,像素的值域為[0,1],0代表黑色,1代表白色,0到1之間的小數(shù)表示不同的灰度等級。二值圖像可以看成是灰度圖像的一個特例。
索引圖像
索引圖像的文件結構比較復雜,除了存放圖像的二維矩陣外,還包括一個稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,如矩陣元素值域為[0,255],則MAP矩陣的大小為256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三個元素分別指定該行對應顏色的紅、綠、藍單色值,MAP中每一行對應圖像矩陣像素的一個灰度值,如某一像素的灰度值為64,則該像素就與MAP中的第64行建立了映射關系,該像素在屏幕上的實際顏色由第64行的[RGB]組合決定。也就是說,圖像在屏幕上顯示時,每一像素的顏色由存放在矩陣中該像素的灰度值作為索引通過檢索顏色索引矩陣MAP得到。索引圖像的數(shù)據(jù)類型一般為8位無符號整形(int8),相應索引矩陣MAP的大小為256Ⅹ3,因此一般索引圖像只能同時顯示256種顏色,但通過改變索引矩陣,顏色的類型可以調整。索引圖像的數(shù)據(jù)類型也可采用雙精度浮點型(double)。索引圖像一般用于存放色彩要求比較簡單的圖像,如Windows中色彩構成比較簡單的壁紙多采用索引圖像存放,如果圖像的色彩比較復雜,就要用到RGB真彩色圖像。
RGB圖像
RGB圖像與索引圖像一樣都可以用來表示彩色圖像。與索引圖像一樣,它分別用紅(R)、綠(G)、藍(B)三原色的組合來表示每個像素的顏色。但與索引圖像不同的是,RGB圖像每一個像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由于每一像素的顏色需由R、G、B三個分量來表示,M、N分別表示圖像的行列數(shù),三個M x N的二維矩陣分別表示各個像素的R、G、B三個顏色分量。RGB圖像的數(shù)據(jù)類型一般為8位無符號整形,通常用于表示和存放真彩色圖像,當然也可以存放灰度圖像。
數(shù)字化圖像數(shù)據(jù)有兩種存儲方式:位圖存儲(Bitmap)和矢量存儲(Vector)
我們平常是以圖像分辨率(即像素點)和顏色數(shù)來描述數(shù)字圖象的。例如一張分辨率為640*480,16位色的數(shù)字圖片,就由2^16=65536種顏色的307200(=640*480)個素點組成。
位圖圖像:位圖方式是將圖像的每一個象素點轉換為一個數(shù)據(jù),當圖像是單色(只有黑白二色)時,8個象素點的數(shù)據(jù)只占據(jù)一個字節(jié)(一個字節(jié)就是8個二進制數(shù),1個二進制數(shù)存放象素點);16色(區(qū)別于前段“16位色”)的圖像每兩個象素點用一個字節(jié)存儲;256色圖像每一個象素點用一個字節(jié)存儲。這樣就能夠精確地描述各種不同顏色模式的圖像圖面。
位圖圖像彌補了矢量式圖像的缺陷,它能夠制作出色彩和色調變化豐富的圖像,可以逼真地表現(xiàn)自然界的景象,同時也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優(yōu)點;而其缺點則是它無法制作真正的3D圖像,并且圖像縮放和旋轉時會產(chǎn)生失真的現(xiàn)象,同時文件較大,對內存和硬盤空間容量的需求也較高。位圖方式就是將圖像的每一像素點轉換為一個數(shù)據(jù)。
如果用1位數(shù)據(jù)來記錄,那么它只能代表2種顏色(2^1=2);如果以8位來記錄,便可以表現(xiàn)出256種顏色或色調(2^8=256),因此使用的位元素越多所能表現(xiàn)的色彩也越多。通常我們使用的顏色有16色、256色、增強16位和真彩色24位。一般所說的真彩色是指24位(2^24)的位圖存儲模式適合于內容復雜的圖像和真實照片。但隨著分辨率以及顏色數(shù)的提高,圖像所占用的磁盤空間也就相當大;另外由于在放大圖像的過程中,其圖像勢必要變得模糊而失真,放大后的圖像像素點實際上變成了像素“方格”。 用數(shù)碼相機和掃描儀獲取的圖像都屬于位圖。
矢量圖像:矢量圖像存儲的是圖像信息的輪廓部分,而不是圖像的每一個象素點。例如,一個圓形圖案只要存儲圓心的坐標位置和半徑長度,以及圓的邊線和內部的顏色即可。該存儲方式的缺點是經(jīng)常耗費大量的時間做一些復雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會失真;圖像的存儲空間也要小得多。所以,矢量圖比較適合存儲各種圖表和工程。
圖像編碼的介紹
對圖像信息編碼,以滿足傳輸和存儲的要求。編碼能壓縮圖像的信息量,但圖像質量幾乎不變。為此,可以采用模擬處理技術,再通過模-數(shù)轉換得到編碼,不過多數(shù)是采用數(shù)字編碼技術。編碼方法有對圖像逐點進行加工的方法,也有對圖像施加某種變換或基于區(qū)域、特征進行編碼的方法。脈碼調制、微分脈碼調制、預測碼和各種變換都是常用的編碼技術。
圖像壓縮的介紹
由數(shù)字化得到的一幅圖像的數(shù)據(jù)量十分巨大,一幅典型的數(shù)字圖像通常由500×500或1000×1000個像素組成。如果是動態(tài)圖像,是其數(shù)據(jù)量更大。因此圖像壓縮對于圖像的存儲和傳輸都十分必要。
有兩類壓縮算法,即無損壓縮和有損壓縮。最常用的無損壓縮算法取空間或時間上相鄰像素值的差,再進行編碼。游程碼就是這類壓縮碼的例子。有損壓縮算法大都采用圖像交換的途徑,例如對圖像進行快速傅里葉變換或離散的余弦變換。著名的、已作為圖像壓縮國際標準的JPEG和MPEG均屬于有損壓縮算法。前者用于靜態(tài)圖像,后者用于動態(tài)圖像。它們已由芯片實現(xiàn)。
看過“圖像處理基本知識“的人還看了:
1.投融資基本知識
2.圖像處理教程
5.圖書館基礎知識