圖像識(shí)別技術(shù)論文
隨著圖像處理技術(shù)的迅速發(fā)展,圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域越來越廣泛。小編整理了圖像識(shí)別技術(shù)論文,歡迎閱讀!
圖像識(shí)別技術(shù)論文篇一
圖像識(shí)別技術(shù)研究綜述
摘要:隨著圖像處理技術(shù)的迅速發(fā)展,圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域越來越廣泛。圖像識(shí)別是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,由于圖像在成像時(shí)受到外部環(huán)境的影響,使得圖像具有特殊性,復(fù)雜性?;趫D像處理技術(shù)進(jìn)一步探討圖像識(shí)別技術(shù)及其應(yīng)用前景。
關(guān)鍵詞:圖像處理;圖像識(shí)別;成像
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)10-2446-02
圖像是客觀景物在人腦中形成的影像,是人類最重要的信息源,它是通過各種觀測(cè)系統(tǒng)從客觀世界中獲得,具有直觀性和易理解性。隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)、人工智能技術(shù)的迅速發(fā)展,圖像處理技術(shù)的應(yīng)用也越來越廣泛,并在科學(xué)研究、教育管理、醫(yī)療衛(wèi)生、軍事等領(lǐng)域已取得的一定的成績(jī)。圖像處理正顯著地改變著人們的生活方式和生產(chǎn)手段,比如人們可以借助于圖像處理技術(shù)欣賞月球的景色、交通管理中的車牌照識(shí)別系統(tǒng)、機(jī)器人領(lǐng)域中的計(jì)算機(jī)視覺等,在這些應(yīng)用中,都離不開圖像處理和識(shí)別技術(shù)。圖像處理是指用計(jì)算機(jī)對(duì)圖像進(jìn)行處理,著重強(qiáng)調(diào)圖像與圖像之間進(jìn)行的交換,主要目標(biāo)是對(duì)圖像進(jìn)行加工以改善圖像的視覺效果并為后期的圖像識(shí)別大基礎(chǔ)[1]。圖像識(shí)別是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。但是由于獲取的圖像本事具有復(fù)雜性和特殊性,使得圖像處理和識(shí)別技術(shù)成為研究熱點(diǎn)。
1 圖像處理技術(shù)
圖像處理(image processing)利用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,以達(dá)到所需的結(jié)果。圖像處理可分為模擬圖像處理和數(shù)字圖像圖像處理,而圖像處理一般指數(shù)字圖像處理。這種處理大多數(shù)是依賴于軟件實(shí)現(xiàn)的。其目的是去除干擾、噪聲,將原始圖像編程適于計(jì)算機(jī)進(jìn)行特征提取的形式,主要包括圖像采樣、圖像增強(qiáng)、圖像復(fù)原、圖像編碼與壓縮和圖像分割。
1)圖像采集,圖像采集是數(shù)字圖像數(shù)據(jù)提取的主要方式。數(shù)字圖像主要借助于數(shù)字?jǐn)z像機(jī)、掃描儀、數(shù)碼相機(jī)等設(shè)備經(jīng)過采樣數(shù)字化得到的圖像,也包括一些動(dòng)態(tài)圖像,并可以將其轉(zhuǎn)為數(shù)字圖像,和文字、圖形、聲音一起存儲(chǔ)在計(jì)算機(jī)內(nèi),顯示在計(jì)算機(jī)的屏幕上。圖像的提取是將一個(gè)圖像變換為適合計(jì)算機(jī)處理的形式的第一步。
2)圖像增強(qiáng),圖像在成像、采集、傳輸、復(fù)制等過程中圖像的質(zhì)量或多或少會(huì)造成一定的退化,數(shù)字化后的圖像視覺效果不是十分滿意。為了突出圖像中感興趣的部分,使圖像的主體結(jié)構(gòu)更加明確,必須對(duì)圖像進(jìn)行改善,即圖像增強(qiáng)。通過圖像增強(qiáng),以減少圖像中的圖像的噪聲,改變?cè)瓉韴D像的亮度、色彩分布、對(duì)比度等參數(shù)。圖像增強(qiáng)提高了圖像的清晰度、圖像的質(zhì)量,使圖像中的物體的輪廓更加清晰,細(xì)節(jié)更加明顯。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,增強(qiáng)后的圖像更加賞欣悅目,為后期的圖像分析和圖像理解奠定基礎(chǔ)。
3)圖像復(fù)原,圖像復(fù)原也稱圖像恢復(fù),由于在獲取圖像時(shí)環(huán)境噪聲的影響、運(yùn)動(dòng)造成的圖像模糊、光線的強(qiáng)弱等原因使得圖像模糊,為了提取比較清晰的圖像需要對(duì)圖像進(jìn)行恢復(fù),圖像恢復(fù)主要采用濾波方法,從降質(zhì)的圖像恢復(fù)原始圖。圖像復(fù)原的另一種特殊技術(shù)是圖像重建,該技術(shù)是從物體橫剖面的一組投影數(shù)據(jù)建立圖像。
4)圖像編碼與壓縮,數(shù)字圖像的顯著特點(diǎn)是數(shù)據(jù)量龐大,需要占用相當(dāng)大的存儲(chǔ)空間。但基于計(jì)算機(jī)的網(wǎng)絡(luò)帶寬和的大容量存儲(chǔ)器無法進(jìn)行數(shù)據(jù)圖像的處理、存儲(chǔ)、傳輸。為了能快速方便地在網(wǎng)絡(luò)環(huán)境下傳輸圖像或視頻,那么必須對(duì)圖像進(jìn)行編碼和壓縮。目前,圖像壓縮編碼已形成國(guó)際標(biāo)準(zhǔn),如比較著名的靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG,該標(biāo)準(zhǔn)主要針對(duì)圖像的分辨率、彩色圖像和灰度圖像,適用于網(wǎng)絡(luò)傳輸?shù)臄?shù)碼相片、彩色照片等方面。由于視頻可以被看作是一幅幅不同的但有緊密相關(guān)的靜態(tài)圖像的時(shí)間序列,因此動(dòng)態(tài)視頻的單幀圖像壓縮可以應(yīng)用靜態(tài)圖像的壓縮標(biāo)準(zhǔn)。圖像編碼壓縮技術(shù)可以減少圖像的冗余數(shù)據(jù)量和存儲(chǔ)器容量、提高圖像傳輸速度、縮短處理時(shí)間。
5)圖像分割技術(shù),圖像分割是把圖像分成一些互不重疊而又具有各自特征的子區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。圖像分割根據(jù)目標(biāo)與背景的先驗(yàn)知識(shí)將圖像表示為物理上有意義的連通區(qū)域的集合。即對(duì)圖像中的目標(biāo)、背景進(jìn)行標(biāo)記、定位,然后把目標(biāo)從背景中分離出來。目前,圖像分割的方法主要有基于區(qū)域特征的分割方法、基于相關(guān)匹配的分割方法和基于邊界特征的分割方法[2]。由于采集圖像時(shí)會(huì)受到各種條件的影響會(huì)是圖像變的模糊、噪聲干擾,使得圖像分割是會(huì)遇到困難。在實(shí)際的圖像中需根據(jù)景物條件的不同選擇適合的圖像分割方法。圖像分割為進(jìn)一步的圖像識(shí)別、分析和理解奠定了基礎(chǔ)。
2 圖像識(shí)別技術(shù)
圖像識(shí)別是通過存儲(chǔ)的信息(記憶中存儲(chǔ)的信息)與當(dāng)前的信息(當(dāng)時(shí)進(jìn)入感官的信息)進(jìn)行比較實(shí)現(xiàn)對(duì)圖像的識(shí)別[3]。前提是圖像描述,描述是用數(shù)字或者符號(hào)表示圖像或景物中各個(gè)目標(biāo)的相關(guān)特征,甚至目標(biāo)之間的關(guān)系,最終得到的是目標(biāo)特征以及它們之間的關(guān)系的抽象表達(dá)。圖像識(shí)別技術(shù)對(duì)圖像中個(gè)性特征進(jìn)行提取時(shí),可以采用模板匹配模型。在某些具體的應(yīng)用中,圖像識(shí)別除了要給出被識(shí)別對(duì)象是什么物體外,還需要給出物體所處的位置和姿態(tài)以引導(dǎo)計(jì)算初工作。目前,圖像識(shí)別技術(shù)已廣泛應(yīng)用于多個(gè)領(lǐng)域,如生物醫(yī)學(xué)、衛(wèi)星遙感、機(jī)器人視覺、貨物檢測(cè)、目標(biāo)跟蹤、自主車導(dǎo)航、公安、銀行、交通、軍事、電子商務(wù)和多媒體網(wǎng)絡(luò)通信等。主要識(shí)別技術(shù)有:
2.1 指紋識(shí)別
指紋識(shí)別是生物識(shí)別技術(shù)中一種最實(shí)用、最可靠和價(jià)格便宜的識(shí)別手段,主要應(yīng)用于身份驗(yàn)證。指紋識(shí)別是生物特征的一個(gè)部分,它具有不變性:一個(gè)人的指紋是終身不變的;唯一性:幾乎沒有兩個(gè)完全相同的指紋[3]。一個(gè)指紋識(shí)別系統(tǒng)主要由指紋取像、預(yù)處理與特征提取、比對(duì)、數(shù)據(jù)庫管理組成。目前,指紋識(shí)別技術(shù)與我們的現(xiàn)實(shí)生活緊密相關(guān),如信用卡、醫(yī)療卡、考勤卡、儲(chǔ)蓄卡、駕駛證、準(zhǔn)考證等。
2.2 人臉識(shí)別 目前大多數(shù)人臉識(shí)別系統(tǒng)使用可見光或紅外圖像進(jìn)行人臉識(shí)別,可見光圖像識(shí)別性能很容易受到光照變化的影響。在戶外光照條件不均勻的情況下,其正確識(shí)別率會(huì)大大降低。而紅外圖像進(jìn)行人臉識(shí)別時(shí)可以克服昏暗光照條件變化影響,但由于紅外線不能穿透玻璃,如果待識(shí)別的對(duì)象戴有眼鏡,那么在圖像識(shí)別時(shí),眼部信息全部丟失,將嚴(yán)重影響人臉識(shí)別的性能[4]。
2.3 文字識(shí)別
文字識(shí)別是將模式識(shí)別、文字處理、人工智能集與一體的新技術(shù),可以自動(dòng)地把文字和其他信息分離出來,通過智能識(shí)別后輸入計(jì)算機(jī),用于代替人工的輸入。文字識(shí)別技術(shù)可以將紙質(zhì)的文檔轉(zhuǎn)換為電子文檔,如銀行票據(jù)、文稿、各類公式和符號(hào)等自動(dòng)錄入,可以提供文字的處理效率,有助于查詢、修改、保存和傳播。文字識(shí)別方法主要有結(jié)構(gòu)統(tǒng)計(jì)模式識(shí)別、結(jié)構(gòu)模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)[5]。由于文字的數(shù)量龐大、結(jié)構(gòu)復(fù)雜、字體字形變化多樣,使得文字識(shí)別技術(shù)的研究遇到一定的阻礙。
3 結(jié)束語
人類在識(shí)別現(xiàn)實(shí)世界中的各種事物或復(fù)雜的環(huán)境是一件輕而易舉的事,但對(duì)于計(jì)算機(jī)來講進(jìn)行復(fù)雜的圖像識(shí)別是非常困難的[6]。在環(huán)境較為簡(jiǎn)單的情況下,圖像識(shí)別技術(shù)取得了一定的成功,但在復(fù)雜的環(huán)境下,仍面臨著許多問題:如在圖像識(shí)別過程中的圖像分割算法之間的性能優(yōu)越性比較沒有特定的標(biāo)準(zhǔn),以及算法本身存在一定的局限性,這使得圖像識(shí)別的最終結(jié)果不十分精確等。
參考文獻(xiàn):
[1] 胡愛明,周孝寬.車牌圖像的快速匹配識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(7):90—91.
[2] 胡學(xué)龍.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2011.
[3] 范立南,韓曉微,張廣淵.圖像處理與模式識(shí)別[M].北京:科學(xué)出版社,2007.
[4] 曉慧,劉志鏡.基于臉部和步態(tài)特征融合的身份識(shí)別[J].計(jì)算機(jī)應(yīng)用,2009,1(29):8.
[5] 陳良育,曾振柄,張問銀.基于圖形理解的漢子構(gòu)型自動(dòng)分析系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2005,25(7):1629-1631.
[6] Sanderson C,Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.
點(diǎn)擊下頁還有更多>>>圖像識(shí)別技術(shù)論文