六月丁香五月婷婷,丁香五月婷婷网,欧美激情网站,日本护士xxxx,禁止18岁天天操夜夜操,18岁禁止1000免费,国产福利无码一区色费

<code id="golbx"><noframes id="golbx"></noframes></code>

學(xué)習(xí)啦 > 論文大全 > 技術(shù)論文 > 圖片檢索技術(shù)論文(2)

圖片檢索技術(shù)論文(2)

時(shí)間：2017-03-08 17:04:05 家文952由分享

圖片檢索技術(shù)論文

　　圖片檢索技術(shù)論文篇二

　　網(wǎng)絡(luò)信息檢索中的圖像檢索技術(shù)

　　[摘要] 圖像檢索是網(wǎng)絡(luò)信息檢索中的重要的組成部分，而其檢索技術(shù)卻相對(duì)滯后?；趦?nèi)容的圖像檢索已成為網(wǎng)絡(luò)信息檢索技術(shù)的研究熱點(diǎn)。本文分析并總結(jié)了圖像檢索的概念，綜述了基于內(nèi)容的圖像檢索系統(tǒng)和相關(guān)技術(shù)。

　　[關(guān)鍵詞] 網(wǎng)絡(luò)信息檢索; 基于內(nèi)容; 圖像檢索技術(shù)

　　[中圖分類(lèi)號(hào)] G354.47 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2013)03- 0073- 02

　　隨著網(wǎng)絡(luò)信息資源的迅速增加，信息多樣化的程度不斷加大，諸如圖形、圖像、音頻、視頻、動(dòng)畫(huà)等多媒體信息日漸豐富，其中圖像信息的需求尤為大量，而當(dāng)前主要以文本方式進(jìn)行檢索的技術(shù)已不能滿(mǎn)足人們對(duì)信息的需求。

　　基于文本的檢索是搜索引擎將網(wǎng)站、網(wǎng)頁(yè)的內(nèi)容索引為一系列的關(guān)鍵字，當(dāng)用戶(hù)輸入相應(yīng)關(guān)鍵字后，系統(tǒng)根據(jù)數(shù)據(jù)庫(kù)中的倒排文檔將關(guān)鍵字映射為網(wǎng)站或網(wǎng)頁(yè)的地址。圖像信息基于文本的檢索技術(shù)，即根據(jù)圖像信息的文件名、路徑名、ALT標(biāo)簽等，將其標(biāo)注為一系列關(guān)鍵字的描述，然后通過(guò)檢索這些描述以達(dá)到檢索圖像信息的目的。這種檢索技術(shù)很不實(shí)用。首先，由于目前的計(jì)算機(jī)視覺(jué)和人工智能技術(shù)都無(wú)法自動(dòng)對(duì)圖像進(jìn)行標(biāo)注，要由人工完整地標(biāo)注網(wǎng)絡(luò)上的所有圖像，不但費(fèi)時(shí)費(fèi)力，而且往往是不準(zhǔn)確或不完整的;其次，不同用戶(hù)對(duì)于同一張圖像的看法不盡相同，導(dǎo)致對(duì)圖像的標(biāo)注沒(méi)有一個(gè)統(tǒng)一標(biāo)準(zhǔn);再次，這種方法將注意力局限在圖像的著錄特征，即文字描述上，不能充分揭示和描述圖像中有代表性的畫(huà)面內(nèi)容特征。所以基于內(nèi)容的圖像檢索技術(shù)應(yīng)用而生。

　　1 基于內(nèi)容的圖像檢索技術(shù)

　　基于內(nèi)容的圖像檢索一般是指靜止圖像的檢索。這種圖像檢索技術(shù)通過(guò)分析圖像的內(nèi)容，提取其顏色、形狀、紋理等可視特征，建立特征索引存儲(chǔ)于特征庫(kù)中，在檢索時(shí)，用戶(hù)只需把自己對(duì)圖像的模糊印象描述出來(lái)(繪制的草圖或通過(guò)掃描儀等在線(xiàn)輸入的圖像)，就可以通過(guò)多次的近似匹配，在大容量圖像庫(kù)中查詢(xún)到所需圖像。基于內(nèi)容的圖像檢索具有較強(qiáng)的客觀性。

　　基于內(nèi)容的圖像檢索算法涉及的相關(guān)技術(shù)比較多，主要有：圖像的分析與特征向量的提取技術(shù)、特征向量數(shù)據(jù)的組織與存儲(chǔ)技術(shù)、圖像數(shù)據(jù)的組織與存儲(chǔ)技術(shù)等。

　　1.1 基于顏色特征的圖像檢索

　　顏色特征是圖像檢索中最基礎(chǔ)的一種檢索依據(jù)，顏色是人識(shí)別圖像的主要感知特征之一。在基于顏色特征的檢索算法中，通常用顏色直方圖來(lái)表示圖像的顏色特征。直方圖能較好地反映圖像中各顏色的頻率分布，橫軸表示顏色等級(jí)，縱軸表示在一個(gè)顏色等級(jí)上，具有該顏色的像素在整幅圖像中所占的比例。直方圖可以對(duì)整幅圖像進(jìn)行最大匹配度檢索。目前關(guān)于色彩的索引方法有兩類(lèi)：基于全局色彩的索引與基于局部色彩的索引。

　　全局色彩的索引就是按全局色彩的分布來(lái)索引圖像，計(jì)算每種顏色的像素，檢索出具有相同顏色內(nèi)容的像素的圖像。其中最為簡(jiǎn)單有用的工具是灰度直方圖。利用圖像的灰度直方圖作為特征指標(biāo)來(lái)描述圖像，一般是利用二維直方圖，如紅—藍(lán)直方圖，它是紅光圖像的灰度值和藍(lán)光圖像的灰度值的函數(shù)。利用色彩直方圖進(jìn)行檢索的方法有許多，如：比例直方圖法、累加直方圖法等。

　　色彩直方圖還不能為像素在圖像中的位置提供線(xiàn)索，為了盡可能少地丟失信息，提出了局部色彩方法。局部色彩的索引對(duì)象是局部相似的顏色區(qū)域，它考慮了顏色的分類(lèi)和一些初級(jí)的顏色特征。用形狀面積、圓度、離心率等來(lái)描述形狀的特征矢量。

　　1.2 基于形狀特征的檢索

　　形狀是刻劃物體的本質(zhì)特征之一，利用形狀來(lái)檢索可提高檢索的準(zhǔn)確性和效率?；谛螤畹臋z索不僅包括傳統(tǒng)意義的基于二維形狀的檢索，還包括三維形狀的檢索。

　　基于圖像內(nèi)物體形狀的檢索，首要問(wèn)題是采用合適的圖像分割算法把不同對(duì)象從圖像中分割出來(lái)，關(guān)鍵是尋找符合人眼感知特性的形狀特征。目前，較好的方法是采用圖像的自動(dòng)分割方法結(jié)合識(shí)別目標(biāo)的前景和背景模型來(lái)得到比較精確的形狀特征。圖像自動(dòng)分割方法的具體思路是：將圖像分塊后，將每個(gè)塊看成是一幅小圖像，計(jì)算每個(gè)小圖像的顏色直方圖特征，則每個(gè)塊間的直方圖是不一樣的，為分析邊緣特征，將相鄰兩個(gè)塊構(gòu)成一個(gè)比較對(duì)，將每個(gè)塊間的差值記錄下來(lái)，同時(shí)記錄差值在一定范圍內(nèi)的數(shù)目，這樣就形成一個(gè)顏色特征差值表。圖像對(duì)象空間位置發(fā)生變化，其特征差值表也就不同。

　　1.3 基于紋理特征的檢索

　　紋理是指圖像在局部區(qū)域內(nèi)可能呈現(xiàn)出不規(guī)則性而在整體上卻表現(xiàn)出某種規(guī)律性。紋理特征是圖像中難以描述的特征，它是一種反映圖像像素灰度級(jí)空間分布的屬性。如果一個(gè)物體內(nèi)部以灰度級(jí)變化明顯而又不是簡(jiǎn)單的色調(diào)變化，那么該物體就有紋理。

　　紋理分析的方法基本可以分為統(tǒng)計(jì)法、結(jié)構(gòu)法、模型法和空間法/頻率域聯(lián)合分析法等4類(lèi)?；诮y(tǒng)計(jì)的方法是對(duì)圖像中的顏色強(qiáng)度的空間分布信息進(jìn)行統(tǒng)計(jì)，主要用于分析像木紋、沙地、草坪等細(xì)致而不規(guī)則的物體;基于結(jié)構(gòu)的方法將重點(diǎn)放在分析紋理元之間的相互關(guān)系和排列規(guī)則上，適用于像布料或磚瓦等一類(lèi)元素組成的紋理以及排列比較規(guī)則的物體;基于模型的方法是假設(shè)紋理按某種類(lèi)型分布，如Markov隨機(jī)場(chǎng)模型、分形模型等?；诳臻g/頻率域聯(lián)合分析法主要包括Cabor變換法和小波變換法等。

　　1.4 基于知識(shí)的圖像檢索

　　基于知識(shí)的圖像檢索也是基于內(nèi)容檢索的重要方法之一。圖像本身是一定數(shù)量的顏色像素點(diǎn)的集合，人類(lèi)能夠識(shí)別出像素點(diǎn)集合的含義是人類(lèi)以自身的知識(shí)賦予圖像意義的過(guò)程。基于知識(shí)的圖像檢索系統(tǒng)為用戶(hù)提供知識(shí)庫(kù)，針對(duì)一個(gè)圖像需求，搜索引擎依次調(diào)入每一幅圖像的內(nèi)容描述，結(jié)合知識(shí)庫(kù)中的相關(guān)知識(shí)，以圖像需求為目標(biāo)進(jìn)行推理，如果需求目標(biāo)得到滿(mǎn)足，則確定這幅圖像符合檢索要求。

　　2 基于內(nèi)容的圖像信息檢索系統(tǒng)

　　目前，基于內(nèi)容的圖像檢索技術(shù)的研究取得了很大的突破，較有影響力的有以下幾個(gè)：　　2.1 QBIC系統(tǒng)

　　QBIC(Query By Image Content)是IBM公司于20世紀(jì)90年代研制的圖像和動(dòng)態(tài)影像檢索系統(tǒng)，其含意是“根據(jù)圖像的內(nèi)容進(jìn)行查詢(xún)”。由IBM Almaden研究中心開(kāi)發(fā)，是基于內(nèi)容的檢索系統(tǒng)的典型代表。QBIC在檢索過(guò)程中用戶(hù)無(wú)須提供文字檢索詞(它也提供關(guān)鍵詞檢索)，只要輸入以圖像形式表達(dá)的檢索要求，即可檢索出一系列相似的圖像。QBIC系統(tǒng)允許使用示例圖像、用戶(hù)構(gòu)建的草圖、選擇的顏色與紋理模式、鏡頭與目標(biāo)運(yùn)動(dòng)等，對(duì)大型圖像和視頻數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)。

　　2.2 Photobook系統(tǒng)

　　Photobook系統(tǒng)是由美國(guó)麻省理工學(xué)院(MIT)的媒體實(shí)驗(yàn)室于1994年開(kāi)發(fā)研制的用于瀏覽和搜索圖像的一套交互式工具，圖像在存儲(chǔ)時(shí)按人臉、形狀或紋理特性自動(dòng)分類(lèi)，圖像根據(jù)類(lèi)別通過(guò)顯著語(yǔ)義特征壓縮編碼。

　　2.3 Virage系統(tǒng)

　　Virage是由Virage公司開(kāi)發(fā)的基于內(nèi)容的圖像搜索引擎。與QBIC相似，Virage支持基于顏色、顏色布局、紋理和結(jié)構(gòu)(對(duì)象邊界信息)的可視化查詢(xún)，但Virage比QBIC更進(jìn)一步，它也支持由4個(gè)原子查詢(xún)的任意組合，用戶(hù)可以根據(jù)他們自己的側(cè)重調(diào)整4個(gè)原子查詢(xún)的權(quán)重。

　　2.4 CORE系統(tǒng)

　　CORE是新加坡國(guó)立大學(xué)開(kāi)發(fā)的一個(gè)基于內(nèi)容的檢索系統(tǒng)。其顯著的技術(shù)特色包括：多種特征提取方法、多種基于內(nèi)容檢索方法、使用自組織神經(jīng)網(wǎng)絡(luò)對(duì)復(fù)雜特征度量、建立基于內(nèi)容索引的新方法以及對(duì)多媒體信息進(jìn)行模糊檢索的新技術(shù)。

　　2.5 VisualSEEK系統(tǒng)

　　由美國(guó)哥倫比亞大學(xué)圖像和高級(jí)電視實(shí)驗(yàn)室開(kāi)發(fā)。它實(shí)現(xiàn)了互聯(lián)網(wǎng)上基于內(nèi)容的圖像/視頻檢索系統(tǒng)，提供了一套工具供人們?cè)赪eb上檢索圖像和視頻信息。用戶(hù)可以把頂部為紅橙黃色區(qū)域、底部為藍(lán)綠色區(qū)域，這樣的圖像作為查詢(xún)“日出”的草圖，使人們?cè)赪eb上可以方便地搜索和檢索圖像和視頻。

　　3 基于內(nèi)容的圖像檢索體系結(jié)構(gòu)

　　基于內(nèi)容的圖像檢索系統(tǒng)與傳統(tǒng)基于文本的檢索系統(tǒng)完全不同。基于內(nèi)容的檢索系統(tǒng)一般通過(guò)可視化界面和用戶(hù)進(jìn)行頻繁的交互，以便用戶(hù)能夠方便地構(gòu)造查詢(xún)和改進(jìn)檢索結(jié)果，用戶(hù)通過(guò)選擇具有代表性的一幅或多幅例子圖像來(lái)構(gòu)造查詢(xún)，然后由系統(tǒng)查找與例子圖像在視覺(jué)內(nèi)容上較相似的圖像，按相似度大小排列返回給用戶(hù)，即所謂的通過(guò)例子圖像的檢索(Query By Image Example)。

　　基于內(nèi)容的圖像查詢(xún)和檢索是一個(gè)逐步求精的循環(huán)過(guò)程。其過(guò)程及各個(gè)模塊如下：

　　3.1 圖像的預(yù)處理

　　在特征抽象子模塊里，首先要進(jìn)行圖像的預(yù)處理，包括圖像格式的轉(zhuǎn)換，尺寸的統(tǒng)一，圖像的增強(qiáng)與去噪，圖像的邊緣提取，經(jīng)過(guò)邊緣提取獲得圖像的輪廓特征，對(duì)其進(jìn)行進(jìn)一步輪廓清晰化處理等功能，為圖像的特征提取打下基礎(chǔ)。

　　3.2 圖像的目標(biāo)標(biāo)識(shí)

　　圖像預(yù)處理后，要進(jìn)行圖像的目標(biāo)標(biāo)識(shí)。目標(biāo)標(biāo)識(shí)為用戶(hù)提供一種工具，以全自動(dòng)或半自動(dòng)(需要用戶(hù)干預(yù))的方式標(biāo)識(shí)圖像中用戶(hù)感興趣的區(qū)域或目標(biāo)對(duì)象，以便針對(duì)目標(biāo)進(jìn)行特征提取并查詢(xún)。當(dāng)進(jìn)行整體內(nèi)容檢索時(shí)，利用全局特征，這時(shí)不用目標(biāo)標(biāo)識(shí)功能。目標(biāo)標(biāo)識(shí)是可選的。

　　3.3 圖像的特征提取與表達(dá)

　　圖像特征的提取與表達(dá)是基于內(nèi)容的圖像檢索技術(shù)的基礎(chǔ)。對(duì)圖像數(shù)據(jù)庫(kù)進(jìn)行特征提取，提取用戶(hù)感興趣的、適合檢索要求的特征。特征提取可以是全局性的，即整幅圖像，也可以是針對(duì)某個(gè)目標(biāo)的，即圖像中的子區(qū)域，如人的面部特征或指紋特征等。

　　3.4 圖像數(shù)據(jù)庫(kù)

　　作為圖像查詢(xún)的后臺(tái)基地，生成的數(shù)據(jù)庫(kù)由圖像庫(kù)、特征庫(kù)和知識(shí)庫(kù)組成。圖像庫(kù)為數(shù)字化的圖像信息，特征庫(kù)包含用戶(hù)輸入的特征和預(yù)處理自動(dòng)提取的內(nèi)容特征。知識(shí)庫(kù)包含專(zhuān)門(mén)和通用知識(shí)，有利于查詢(xún)優(yōu)化和快速匹配，知識(shí)庫(kù)中知識(shí)表達(dá)可以更換以適用各種不同的應(yīng)用領(lǐng)域。

　　3.5 圖像的查詢(xún)接口

　　在基于內(nèi)容檢索中，由于特征值為高維向量，不具有直觀性，因此必須為其提供一個(gè)可視化的輸入手段。友好的人機(jī)交互界面是一個(gè)成功檢索系統(tǒng)不可缺少的條件，可采用的方式有3種：操縱交互輸入方式、模板選擇輸入方式和用戶(hù)提交特征樣板的輸入方式。另外，查詢(xún)返回的結(jié)果需要瀏覽，應(yīng)在用戶(hù)界面提供瀏覽功能。

　　3.6 圖像的檢索引擎

　　檢索是利用特征之間的距離函數(shù)進(jìn)行相似性匹配，模仿人的認(rèn)知過(guò)程，近似得到數(shù)據(jù)庫(kù)的認(rèn)知排隊(duì)，存在一些不同的相似性測(cè)度算法，檢索引擎中包括一個(gè)較為有效可靠的相似性測(cè)度函數(shù)集。

　　3.7 圖像的索引/過(guò)濾

　　索引是用來(lái)提供快速、有選擇性地存取數(shù)據(jù)庫(kù)的一種機(jī)制，它相當(dāng)于一種映射機(jī)制，將屬性的值轉(zhuǎn)換為相應(yīng)數(shù)據(jù)地址域的地址集。過(guò)濾器作用于全部數(shù)據(jù)，過(guò)濾出的數(shù)據(jù)集合再用高維特征匹配來(lái)檢索。索引用于低維特征，可以用R樹(shù)來(lái)索引以加快檢索速度。

　　基于內(nèi)容的圖像檢索技術(shù)為用戶(hù)提供了一個(gè)在網(wǎng)絡(luò)上搜索感興趣的圖像信息資源的有效手段，但基于內(nèi)容的圖像檢索技術(shù)目前還存在許多有待發(fā)掘的內(nèi)容，因而，基于內(nèi)容的圖像檢索技術(shù)也需要隨著網(wǎng)絡(luò)技術(shù)、信息技術(shù)的發(fā)展而發(fā)展。

　　主要參考文獻(xiàn)

　　[1] 何惠芬. 圖書(shū)館中基于內(nèi)容的圖像數(shù)據(jù)庫(kù)檢索技術(shù)[J]. 情報(bào)雜志，2002(7).

　　[2] 劉偉成，孫吉紅. 基于內(nèi)容的圖像信息檢索綜述[J]. 情報(bào)科學(xué)，2002(4).

　　
看了“圖片檢索技術(shù)論文”的人還看：

1.搜索引擎技術(shù)論文

2.關(guān)于檢索的學(xué)術(shù)論文

3.淺談基于PCA算法的人臉識(shí)別的圖片搜索引擎論文

4.計(jì)算機(jī)檢索技術(shù)論文

5.可視化圖形技術(shù)論文

相關(guān)文章

熱門(mén)文章

2774655