計(jì)算機(jī)文獻(xiàn)檢索論文
計(jì)算機(jī)文獻(xiàn)檢索論文
電子計(jì)算機(jī)文獻(xiàn)檢索系統(tǒng)是指廣泛利用電子計(jì)算機(jī)和現(xiàn)代化通訊技術(shù),進(jìn)行文獻(xiàn)加工、檢索和遠(yuǎn)距離傳遞的自動(dòng)化系統(tǒng)。下面是學(xué)習(xí)啦小編為大家整理的計(jì)算機(jī)文獻(xiàn)檢索論文,供大家參考。
計(jì)算機(jī)文獻(xiàn)檢索論文篇一
專利文獻(xiàn)計(jì)算機(jī)檢索技術(shù)的最新發(fā)展
[摘要]通過(guò)對(duì)近年來(lái)計(jì)算機(jī)科學(xué)、人工智能、專利文獻(xiàn)加工等領(lǐng)域的發(fā)展進(jìn)行總結(jié),從多語(yǔ)言混合檢索、分類檢索、語(yǔ)義檢索、圖像檢索以及輔助技術(shù)五個(gè)方面介紹專利文獻(xiàn)計(jì)算機(jī)檢索技術(shù)的最新發(fā)展。機(jī)器翻譯技術(shù)和多邊共同分類體系的完善有助于提高計(jì)算機(jī)檢索效率、消除語(yǔ)言障礙,而語(yǔ)義檢索、圖像檢索和文獻(xiàn)自動(dòng)處理技術(shù)的發(fā)展有望使面向不同層次用戶的計(jì)算機(jī)智能化檢索系統(tǒng)得以實(shí)現(xiàn)。
[關(guān)鍵詞]專利文獻(xiàn) 計(jì)算機(jī)檢索 語(yǔ)義檢索 圖像檢索
[分類號(hào)]G352
1 前言
近年來(lái),計(jì)算機(jī)技術(shù)、語(yǔ)言學(xué)以及人工智能技術(shù)的發(fā)展促進(jìn)了整個(gè)信息檢索技術(shù)領(lǐng)域的發(fā)展,專利文獻(xiàn)的計(jì)算機(jī)檢索技術(shù)正成為情報(bào)檢索領(lǐng)域研究的熱點(diǎn)。下文擬從多語(yǔ)言混合檢索、分類檢索、語(yǔ)義檢索、圖像檢索以及輔助技術(shù)五個(gè)方面介紹專利文獻(xiàn)計(jì)算機(jī)檢索技術(shù)的最新發(fā)展。
2 多語(yǔ)言混合檢索
專利文獻(xiàn)是由各國(guó)、各地區(qū)專利局或世界知識(shí)產(chǎn)權(quán)局出版的官方文獻(xiàn),因此一般以各局官方語(yǔ)言出版。雖然大部分專利文獻(xiàn)是英語(yǔ)文獻(xiàn),但是仍然存在大量日文、中文、德文、法文及其他語(yǔ)種的文獻(xiàn)。出版語(yǔ)言的多樣性給專利文獻(xiàn)的檢索和利用帶來(lái)了極大的障礙,要實(shí)現(xiàn)多語(yǔ)言混合檢索,機(jī)器翻譯是必不可少的技術(shù)。目前一些專利局在其官方網(wǎng)站上推出了機(jī)器翻譯系統(tǒng),例如我國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局提供有漢英機(jī)器翻譯,日本特許廳提供有日英機(jī)器翻譯,韓國(guó)知識(shí)產(chǎn)權(quán)局提供有韓英機(jī)器翻譯等,上述網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)對(duì)其他國(guó)家的用戶閱讀方便和使用本國(guó)專利文獻(xiàn)起到了幫助作用。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,機(jī)器翻譯的技術(shù)也迅速發(fā)展,從傳統(tǒng)的基于規(guī)則的機(jī)器翻譯擴(kuò)展到了基于實(shí)例或模版的機(jī)器翻譯、統(tǒng)計(jì)機(jī)器翻譯等。尤其是近年來(lái)語(yǔ)言學(xué)和人工智能技術(shù)的發(fā)展,以語(yǔ)義描述或以知識(shí)描述為特征的智能機(jī)器翻譯系統(tǒng)正逐步成為研究的熱點(diǎn)。專利文獻(xiàn)作為一種特殊的科技文獻(xiàn),由于其具有特定的句法和語(yǔ)言結(jié)構(gòu),同時(shí)例如權(quán)利要求書(shū)等具有法律公示性文件的作用,這對(duì)翻譯的準(zhǔn)確性提出了更高的要求,已有研究者通過(guò)在機(jī)器翻譯系統(tǒng)內(nèi)集成多個(gè)翻譯引擎、對(duì)不同特點(diǎn)的內(nèi)容使用不同引擎翻譯的方式來(lái)提高翻譯質(zhì)量。
已有的機(jī)器翻譯系統(tǒng)基本局限于單篇文獻(xiàn)的機(jī)器翻譯,無(wú)法實(shí)現(xiàn)真正的多語(yǔ)言混合檢索。多語(yǔ)言混合檢索系統(tǒng)不僅可以允許混合語(yǔ)言的檢索式,而且同一個(gè)檢索式還可以對(duì)不同語(yǔ)言的專利文獻(xiàn)進(jìn)行檢索,其實(shí)現(xiàn)方式主要有如下三種:翻譯檢索式、翻譯文獻(xiàn)或者兩者相結(jié)合的混合式。翻譯檢索式的工作量小,比較適合于因特網(wǎng)檢索,但由于檢索式通常缺乏語(yǔ)境,翻譯難度較大;翻譯文獻(xiàn)的方式雖然有利于提高翻譯質(zhì)量,進(jìn)而有利于文獻(xiàn)檢索,但存在的主要問(wèn)題是翻譯量太大、翻譯時(shí)間長(zhǎng)。
3 分類檢索
分類號(hào)一直是專利文獻(xiàn)檢索的重要手段。目前除了基本涵蓋各國(guó)專利文獻(xiàn)的國(guó)際專利分類(IPC)之外,美國(guó)專利商標(biāo)局、日本特許廳和歐洲專利局各自都有自己的分類體系,分別是UC、FI/FT和ECLA。IPC雖然通用,但存在分類標(biāo)準(zhǔn)不統(tǒng)一、分類條目不夠完備、文獻(xiàn)分類更新不及時(shí)等缺陷,導(dǎo)致使用IPC檢索的效果欠佳。UC和FI/FT分別只能檢索美國(guó)和日本的專利文獻(xiàn),ECLA雖然能夠檢索到多國(guó)的文獻(xiàn),但仍然不能有效地檢索日本、韓國(guó)、中國(guó)等國(guó)的專利文獻(xiàn)。
為改善這種局面,美國(guó)、日本和歐洲自2000年即開(kāi)始了“三邊分類和諧計(jì)劃”,該計(jì)劃旨在推進(jìn)ECLA、UC和FI三個(gè)分類體系的融合以增強(qiáng)分類號(hào)檢索的功能,同時(shí)對(duì)現(xiàn)有IPC分類體系提出改進(jìn)建議。依據(jù)2009年召開(kāi)的第27次三邊會(huì)議,韓國(guó)知識(shí)產(chǎn)權(quán)局已經(jīng)加入上述計(jì)劃,而中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局也以觀察國(guó)的身份參與這項(xiàng)工作。此外,近年來(lái)美國(guó)專利商標(biāo)局、日本特許廳、歐洲專利局、韓國(guó)知識(shí)產(chǎn)權(quán)局和中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局五局積極開(kāi)展合作,其中一個(gè)重要的合作項(xiàng)目是“共同的分類”。該項(xiàng)目的實(shí)施將有利于提高分類的一致性,擴(kuò)展或細(xì)化部分技術(shù)領(lǐng)域的分類,進(jìn)而提高檢索的效率和質(zhì)量。
不管是美日歐三方開(kāi)展的“三邊分類和諧計(jì)劃”,還是五局共同開(kāi)展的“共同的分類”項(xiàng)目,都必將推進(jìn)專利文獻(xiàn)分類體系的進(jìn)一步發(fā)展,實(shí)現(xiàn)真正意義上的“基于檢索的分類”,進(jìn)一步增強(qiáng)分類號(hào)在專利文獻(xiàn)計(jì)算機(jī)檢索中的作用。
4 語(yǔ)義檢索
當(dāng)前專利文獻(xiàn)檢索的主要手段為關(guān)鍵詞和分類號(hào)檢索,而由于一詞多義、一義多詞,專利文獻(xiàn)撰寫(xiě)、加工和翻譯質(zhì)量不一以及關(guān)鍵詞的機(jī)械匹配等問(wèn)題,本質(zhì)上決定了其查全率和查準(zhǔn)率受限制。隨著計(jì)算技術(shù)、人工智能、自然語(yǔ)言處理等技術(shù)的發(fā)展,搜索引擎的智能化有望從根本上提高現(xiàn)有檢索系統(tǒng)的檢索質(zhì)量。
搜索引擎的智能化具體表現(xiàn)為語(yǔ)義檢索,也稱為知識(shí)檢索或概念檢索。語(yǔ)義檢索是對(duì)檢索條件、信息組織及檢索結(jié)果顯示賦予一定語(yǔ)義成分的一種新的檢索方式。語(yǔ)義檢索的本質(zhì)在于以語(yǔ)義為對(duì)象進(jìn)行搜索,而不是對(duì)字符串進(jìn)行簡(jiǎn)單的機(jī)械匹配,因此可避免關(guān)鍵詞匹配檢索中由于詞和義不對(duì)應(yīng)所導(dǎo)致的問(wèn)題。
語(yǔ)義檢索過(guò)程一般包括對(duì)被檢索的文檔以及輸入的檢索式進(jìn)行語(yǔ)義分析和匹配處理。這種語(yǔ)義分析處理依賴于詞匯的語(yǔ)義描述技術(shù)以及分別用于詞義鑒別和詞匯過(guò)濾的語(yǔ)義識(shí)別技術(shù)和詞匯鏈算法。可以通過(guò)諸如WordNet等語(yǔ)義詞典對(duì)詞匯實(shí)現(xiàn)較完備的語(yǔ)義描述,保證人和機(jī)器對(duì)詞匯的理解一致。
最新發(fā)展的潛在語(yǔ)義索引通過(guò)將文獻(xiàn)搜索過(guò)程中的向量空間模型和奇異值分解相結(jié)合,可以揭示文檔中的詞間關(guān)系,因而適于構(gòu)建專利文獻(xiàn)搜索引擎”…。利用語(yǔ)義進(jìn)行檢索還可以將專利文獻(xiàn)中的非技術(shù)性信息考慮在內(nèi),例如將特定的技術(shù)概念和申請(qǐng)人、發(fā)明人等信息進(jìn)行語(yǔ)義聯(lián)系。此外,語(yǔ)義檢索還可以從用戶角度出發(fā),考慮用戶的檢索需求,從而為諸如查新、侵權(quán)等不同目的的檢索提供相應(yīng)的結(jié)果。
近年來(lái)國(guó)內(nèi)一些開(kāi)發(fā)商也紛紛提供具有語(yǔ)義檢索功能的專利文獻(xiàn)檢索系統(tǒng),例如東方靈盾開(kāi)發(fā)的專利檢索系統(tǒng)和Patenticst網(wǎng)站。Patentics網(wǎng)站除了可以實(shí)現(xiàn)傳統(tǒng)的關(guān)鍵詞檢索功能,還支持語(yǔ)義檢索,僅通過(guò)輸入檢索所針對(duì)的專利文獻(xiàn)號(hào),即可自動(dòng)對(duì)其進(jìn)行語(yǔ)義分析、文獻(xiàn)檢索,并對(duì)結(jié)果進(jìn)行相關(guān)度排序。當(dāng)前專利文獻(xiàn)檢索領(lǐng)域還未廣泛應(yīng)用語(yǔ)義檢索,但隨著研究的深入,相信未來(lái)的搜索引擎不僅能利用語(yǔ)義技術(shù)提高檢索的效率,還有望能對(duì)檢索結(jié)果進(jìn)行分析、評(píng)價(jià),甚至自動(dòng)生成檢索報(bào)告。
5 圖像檢索
根據(jù)對(duì)圖像檢索所使用方法的特征可以分為基于文本的圖像檢索法(TBIR)和基于內(nèi)容的圖像檢索法(cBIR)。專利文獻(xiàn)一般都帶有大量的附圖,包括機(jī)械結(jié)構(gòu)或化學(xué)結(jié)構(gòu)式附圖、電路圖、方框圖、流程圖或曲線圖等。與傳統(tǒng)的關(guān)鍵詞檢索和分類號(hào)檢索相比,CBIR更加直觀、快速,而且可以克服因文字表述差異而導(dǎo)致的漏檢,因此它正在成為專利文獻(xiàn)檢索領(lǐng)域的研究熱點(diǎn)。專利文獻(xiàn)的附圖都是黑白二元圖像(本文
所稱專利是指發(fā)明和實(shí)用新型專利,不包括外觀設(shè)計(jì)專利),不存在顏色和紋理等特征,因此專利文獻(xiàn)的圖像檢索主要是基于形狀和區(qū)域的圖像特征。
雖然目前還沒(méi)有成熟的專利文獻(xiàn)圖像檢索系統(tǒng),但一些研究機(jī)構(gòu)已經(jīng)開(kāi)發(fā)出若干可專門用于專利文獻(xiàn)的圖像檢索原型系統(tǒng),例如IIT Kanpur的PATseek、Informatics and Telematics Institute的PatMediat以及LTUtechnologies公司的ImageSeeker等。PATseek專門針對(duì)美國(guó)專利文獻(xiàn)進(jìn)行圖像檢索,而PatMedia網(wǎng)站上的試驗(yàn)系統(tǒng)僅針對(duì)歐洲專利局的專利文獻(xiàn),這兩個(gè)圖像檢索系統(tǒng)都可實(shí)現(xiàn)直接輸入待檢索的圖像,系統(tǒng)自動(dòng)進(jìn)行相似度匹配,直接提供專利附圖,同時(shí)還可以進(jìn)行基于文本的圖像檢索。
典型的專利圖像檢索系統(tǒng)包括專利文獻(xiàn)處理部分和圖像檢索部分,如圖1所示:
文獻(xiàn)處理部分又進(jìn)一步包括文獻(xiàn)預(yù)處理和視覺(jué)、文本元數(shù)據(jù)提取和索引兩部分。前者是找出文獻(xiàn)中的圖形和對(duì)應(yīng)的文字描述;后者則是進(jìn)一步進(jìn)行圖像特征分析和文本分析,分別提取基本的圖像特征以及能夠表示圖形含義的高層語(yǔ)義特征的關(guān)鍵詞,由此分別形成索引后的圖形特征矢量庫(kù)、圖像庫(kù)、文本描述關(guān)鍵詞庫(kù)和知識(shí)庫(kù)。在圖像檢索部分,基于上述提取的元數(shù)據(jù),進(jìn)行圖像相似度匹配,同時(shí)還可以基于文本進(jìn)行圖像檢索。與一般領(lǐng)域的圖形檢索相比,由于專利文獻(xiàn)中每幅圖形一般都對(duì)應(yīng)有文字描述,即使不再進(jìn)行人工標(biāo)注或自動(dòng)標(biāo)注,都能提取到較好的高層語(yǔ)義特征,這對(duì)提高專利文獻(xiàn)圖形檢索的準(zhǔn)確性非常有幫助。
目前因特網(wǎng)上最新版本的PatMedia專利文獻(xiàn)圖像檢索系統(tǒng)不僅提供有圖像輸入的檢索方式,還提供有文獻(xiàn)號(hào)、關(guān)鍵詞輸入的檢索方式;此外,對(duì)于檢索結(jié)果還可以進(jìn)一步使用文本過(guò)濾、類別過(guò)濾等功能。下面示例性地給出了利用PatMedia進(jìn)行圖像檢索的結(jié)果(見(jiàn)圖2、圖3),輸入如圖2所示的圖像,該系統(tǒng)可以檢索出如圖3所示的結(jié)果(僅列出部分結(jié)果)。
目前專利文獻(xiàn)圖像檢索系統(tǒng)僅處于試驗(yàn)階段,只能對(duì)數(shù)量非常少的特定專利文獻(xiàn)進(jìn)行檢索,且檢索結(jié)果相關(guān)度還不是很高,但由于圖像檢索具有其他任何檢索方式都不具備的優(yōu)點(diǎn),相信隨著人們對(duì)專利文獻(xiàn)圖像檢索技術(shù)的進(jìn)一步研究以及語(yǔ)義檢索技術(shù)的進(jìn)一步發(fā)展,實(shí)現(xiàn)高精度的圖像檢索必將成為現(xiàn)實(shí)。
6 輔助技術(shù)
高質(zhì)量的專利文獻(xiàn)是提高檢索質(zhì)量的基礎(chǔ)。專利文獻(xiàn)分類、標(biāo)引和摘要改寫(xiě)是專利文獻(xiàn)加工的主要內(nèi)容。傳統(tǒng)的專利文獻(xiàn)加工方法主要依賴于人工,其成本高且速度受限制,質(zhì)量不統(tǒng)一。隨著人工智能和計(jì)算機(jī)技術(shù)的發(fā)展,開(kāi)始出現(xiàn)對(duì)專利文獻(xiàn)進(jìn)行自動(dòng)分類、自動(dòng)標(biāo)引、自動(dòng)摘要和自動(dòng)聚類。
專利文獻(xiàn)自動(dòng)分類已經(jīng)在歐洲、美國(guó)、日本得到了廣泛的研究和嘗試。例如歐洲專利局已經(jīng)利用自然語(yǔ)言處理的相關(guān)技術(shù)實(shí)現(xiàn)了專利文獻(xiàn)的自動(dòng)初分類;對(duì)日本專利文獻(xiàn)自動(dòng)分類研究表明,對(duì)于使用K臨近算法進(jìn)行自動(dòng)分類的情況下,先將專利文獻(xiàn)按部分結(jié)構(gòu)化為語(yǔ)義單元可以提高74%的效率。
PATExpert代表了目前較先進(jìn)的專利文獻(xiàn)自動(dòng)處理技術(shù)的發(fā)展,通過(guò)基于語(yǔ)義網(wǎng)的語(yǔ)義處理技術(shù)實(shí)現(xiàn)了面向內(nèi)容的專利文獻(xiàn)自動(dòng)處理,其中的一個(gè)主要技術(shù)是利用一定的語(yǔ)義表示結(jié)構(gòu)實(shí)現(xiàn)專利文獻(xiàn)知識(shí)層面的表達(dá)。該系統(tǒng)可以執(zhí)行的處理任務(wù)包括:專利文獻(xiàn)內(nèi)容和元數(shù)據(jù)的自動(dòng)抽取;全文、圖像、相關(guān)性搜索引擎;專利文獻(xiàn)的自動(dòng)分類和聚類;面向多語(yǔ)言的輔助理解工具;專利價(jià)值自動(dòng)評(píng)估等。
國(guó)內(nèi)有一些研究機(jī)構(gòu)開(kāi)展了大量的基于IPC體系的專利文獻(xiàn)自動(dòng)分類的研究,這些研究大部分集中在統(tǒng)計(jì)分類技術(shù)。近年來(lái)隨著人工智能技術(shù)的興起,基于人工智能或語(yǔ)義的專利文獻(xiàn)自動(dòng)分類發(fā)展迅速,例如上文提到的Patentics試驗(yàn)系統(tǒng)也開(kāi)始嘗試對(duì)專利文獻(xiàn)進(jìn)行自動(dòng)分類。
中文專利文獻(xiàn)的自動(dòng)處理仍處于研究階段,雖然國(guó)外專利文獻(xiàn)自動(dòng)處理已經(jīng)積累了許多寶貴經(jīng)驗(yàn),但由于中文表述的特殊性,許多技術(shù)還待消化和開(kāi)發(fā),例如漢語(yǔ)詞匯之間的分詞技術(shù)是制約自動(dòng)標(biāo)引質(zhì)量的一個(gè)障礙。隨著信息處理自動(dòng)化相關(guān)技術(shù)的發(fā)展,專利文獻(xiàn)的自動(dòng)分類、自動(dòng)標(biāo)引、自動(dòng)聚類和自動(dòng)摘要正在逐步由半自動(dòng)走向全自動(dòng)化,這給搜索引擎的發(fā)展帶來(lái)了極大的便利。同時(shí),利用語(yǔ)義技術(shù)實(shí)現(xiàn)基于內(nèi)容的自動(dòng)處理將是未來(lái)的發(fā)展主流,也是提高專利文獻(xiàn)自動(dòng)處理質(zhì)量的主要手段。
7 結(jié)語(yǔ)
專利文獻(xiàn)計(jì)算機(jī)檢索是一個(gè)涉及了多學(xué)科的研究領(lǐng)域,其中以語(yǔ)義檢索為核心的技術(shù)推動(dòng)了搜索引擎、機(jī)器翻譯、圖像檢索等相關(guān)技術(shù)的發(fā)展,而由于專利文獻(xiàn)的特殊性,分類體系和文獻(xiàn)自動(dòng)處理技術(shù)也在其中占據(jù)了重要地位。隨著研究的進(jìn)一步深入,現(xiàn)存的語(yǔ)言障礙和檢索效率低下等缺陷在不久的將來(lái)必將逐漸被克服,不同層次的用戶有望借助于智能化的自動(dòng)檢索系統(tǒng)便利地實(shí)現(xiàn)專業(yè)化檢索。
計(jì)算機(jī)文獻(xiàn)檢索論文篇二
熟悉文獻(xiàn)檢索工具 學(xué)會(huì)檢索文獻(xiàn)資料
摘 要:在學(xué)術(shù)研究和論文寫(xiě)作中,我們經(jīng)常需要檢索查找資料數(shù)據(jù),但是在浩若煙海的文獻(xiàn)中,如何快速準(zhǔn)確地找到所需要的文獻(xiàn),這就要求我們對(duì)文獻(xiàn)檢索的知識(shí)和技術(shù)有一定的了解,在本文中,介紹了文獻(xiàn)檢索的一些基本知識(shí),主要針對(duì)的是手工文獻(xiàn)檢索的方法、步驟、途經(jīng)和方法。
關(guān)鍵詞:文獻(xiàn)檢索; 檢索工具
中圖分類號(hào):G250 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-3315(2012)07-144-002
德國(guó)柏林圖書(shū)館的大門上,刻有這樣一句話:“在這里是人類知識(shí)的寶庫(kù),如果你掌握它的鑰匙的話,那么全部知識(shí)都是你的。”這把鑰匙就是圖書(shū)館各種類型的檢索工具和檢索工具書(shū)。
一、了解圖書(shū)館目錄組織,掌握目錄的檢索方法
大學(xué)生在校學(xué)習(xí)期間,由于年級(jí)的不同,利用圖書(shū)館學(xué)習(xí)所使用檢索文獻(xiàn)資料的工具也有所不同,低年級(jí)時(shí)最常使用的是圖書(shū)館的目錄,而到了高年級(jí),除了使用其目錄(手檢或機(jī)檢)外,就是利用文獻(xiàn)檢索工具書(shū)和計(jì)算機(jī)檢索所需文獻(xiàn)。
圖書(shū)館的目錄,也稱藏書(shū)目錄,是按一定規(guī)則而組成的。它是向讀者揭示、宣傳館藏圖書(shū)內(nèi)容,幫助讀者迅速而準(zhǔn)確地查找文獻(xiàn)資料,提供檢索途徑的重要工具,也是讀者利用圖書(shū)館,發(fā)掘知識(shí)寶庫(kù)的入門鑰匙。
圖書(shū)館的目錄,對(duì)讀者而言也稱讀者目錄,它的種類較多,按文字分,有中文、西文、日文、俄文目錄;按查找途徑分,有分類、書(shū)名、著者、主題等目錄,按文獻(xiàn)類型分,有圖書(shū)、期刊、資料、聲象資料目錄等。
1.圖書(shū)目錄
1.1分類目錄。館藏圖書(shū)是根據(jù)各館使用的圖書(shū)分類法,按圖書(shū)內(nèi)容的科學(xué)體系進(jìn)行分類組成的目錄,來(lái)揭示一個(gè)圖書(shū)館的藏書(shū)。所以,讀者要想了解某學(xué)科或?qū)I(yè)館藏圖書(shū)的情況,或者想查找到某類的圖書(shū),就可通過(guò)分類目錄進(jìn)行檢索。
1.2書(shū)名目錄,是按書(shū)名的漢語(yǔ)拼音或筆畫(huà)、字母順序等方法排列組成的目錄,它是從圖書(shū)名稱方面來(lái)揭示一個(gè)圖書(shū)館的藏書(shū)。如果讀者已知書(shū)名,便可利用書(shū)名目錄檢索所需圖書(shū)。
中文圖書(shū)目錄,是按漢語(yǔ)拼音字母順序加筆畫(huà)排列的目錄,也就是先將同音漢字(包括聲調(diào))排在一起,然后對(duì)音同字不同的漢字再按筆畫(huà)順序和筆形順序排列。
日文書(shū)名目錄,以漢字為起始的,先按《日本實(shí)用漢字表》(也有用漢語(yǔ)拼音字母順序)的筆畫(huà)順序排列,同筆畫(huà)的按筆形的順序排列。書(shū)名是以日文假名起始的,則按日文五十音圖順序排列。
西文和俄文的書(shū)名目錄,都是按原文字母的順序排列而組成的目錄,但應(yīng)注意,西文圖書(shū)書(shū)名前頭的冠詞,在組成書(shū)名目錄時(shí)是省略的。
1.3著者目錄,是按著者姓名漢語(yǔ)拼音字母順序或筆畫(huà)、字母順序排列而組成的目錄。它是從圖書(shū)著者方面揭示館藏圖書(shū)的。如果讀者想知道館藏某一作者都有哪些圖書(shū)或想借到某作者的圖書(shū),就可利用著者目錄進(jìn)行檢索。
但利用西文、俄文著者目錄時(shí)要注意,歐美人的習(xí)慣是名在前,姓在后,所以在查找時(shí)要倒過(guò)來(lái)才能查到。
1.4主題目錄,也稱標(biāo)引目錄,它是用扼要的、經(jīng)過(guò)規(guī)范的詞匯,揭示圖書(shū)所研究的對(duì)象或所論述問(wèn)題的基本內(nèi)容。這種目錄的特點(diǎn),使凡研究對(duì)象相同的圖書(shū),都給以同樣的主題,予以集中。這種目錄的排列,是按主題詞的字母或筆畫(huà)的順序而組成的目錄。如果讀者要查找某一專題比較完整的圖書(shū)資料,就可利用主題目錄進(jìn)行檢索。
另外,圖書(shū)館還編制有書(shū)本式館藏目錄,藏有一些圖書(shū)館書(shū)本式館藏目錄。這樣,讀者還可通過(guò)館藏書(shū)本式目錄查找所需圖書(shū),或者經(jīng)查找本館無(wú)館藏時(shí)還可通過(guò)其他館書(shū)本式目錄進(jìn)行檢索,查找到后便可通過(guò)館際互借或其他途徑借到所需圖書(shū)。
2.期刊目錄
期刊是連續(xù)出版物,種類相對(duì)比較穩(wěn)定。期刊目錄的排列是按刊名和分類組成兩種目錄。它是揭示館藏期刊方面的目錄。中文期刊刊名目錄,是按刊名的漢語(yǔ)拼音字母或筆畫(huà)順序排列的。外文期刊刊名目錄,一般是按文字字母(省略刊名前邊的冠詞)順序排列的。分類目錄,是按各館使用的圖書(shū)分類法進(jìn)行分類,組成分類目錄。
另外,各館還編制有書(shū)本式館藏期刊目錄,藏有地區(qū)性和系統(tǒng)的期刊聯(lián)合目錄。如果讀者通過(guò)上述兩種途徑經(jīng)查找本館不藏此種期刊時(shí),還可通過(guò)查找聯(lián)合目錄,查到哪個(gè)館藏有所需期刊,這樣便可通過(guò)館際互借或其他方式借到或復(fù)制方法得到所需文獻(xiàn)。
至于資料、聲象資料的目錄組織基本與書(shū)刊目錄組織大同小異,在這里就不一一介紹。據(jù)調(diào)查,一個(gè)了解圖書(shū)館目錄組織、熟練掌握目錄檢索方法的學(xué)生,僅用2分鐘左右就可查到所需圖書(shū);相反,不了解目錄排列規(guī)則,不掌握目錄檢索途徑的學(xué)生,要花上l一2個(gè)小時(shí)才能查找到所需圖書(shū)。所以大學(xué)生在校學(xué)習(xí)期間,一定要了解圖書(shū)館目錄組織,熟練地利用目錄檢索所需書(shū)刊資料,將終身受益。
二、熟悉文獻(xiàn)檢索工具書(shū),學(xué)會(huì)檢索文獻(xiàn)的途徑、方法與步驟
為了使科學(xué)技術(shù)工作者及時(shí)、有效地利用文獻(xiàn)資料,圖書(shū)情報(bào)文獻(xiàn)工作者相繼編輯了許多文獻(xiàn)檢索工具書(shū)。在當(dāng)代信息社會(huì)中,大學(xué)生熟悉文獻(xiàn)檢索工具書(shū),學(xué)會(huì)檢索文獻(xiàn)的途徑與方法,不僅對(duì)獨(dú)立獲取文獻(xiàn)進(jìn)行自學(xué)和培養(yǎng)自學(xué)能力十分有益,而且還可大大增強(qiáng)情報(bào)意識(shí),不斷獲取情報(bào)信息也有著重要作用。
1.熟悉查找國(guó)內(nèi)外文獻(xiàn)的工具書(shū)
利用文獻(xiàn)檢索工具書(shū)檢索文獻(xiàn),首要一點(diǎn)就是要選準(zhǔn)文獻(xiàn)檢索工具書(shū)。
1.1查找國(guó)內(nèi)文獻(xiàn)的工具書(shū)。查找國(guó)內(nèi)文獻(xiàn)資料的工具書(shū)主要有:《全國(guó)總書(shū)目》《全國(guó)新書(shū)目》《全國(guó)報(bào)刊資料索引》《國(guó)內(nèi)內(nèi)部期刊索引》《內(nèi)部期刊篇名目錄》、《國(guó)內(nèi)科技資料目錄》《科學(xué)技術(shù)譯文通報(bào)》以及其他檢索工具書(shū)如文摘等等。
1.2查找國(guó)外文獻(xiàn)的工具書(shū)。查找國(guó)外文獻(xiàn)資料的工具書(shū)主要有:《科技文摘》《國(guó)外科技資料索引》《國(guó)外科技資料館藏目錄》《專利文摘》和《專利目錄》《國(guó)外報(bào)刊目錄》《北京圖書(shū)館外文新書(shū)通報(bào)》等等。
另外,國(guó)外版的檢索工具書(shū)主要有:《化學(xué)文摘》《生物學(xué)文摘》《科學(xué)文摘》《伍利希國(guó)際期刊目錄》《科學(xué)文摘雜志》《科學(xué)技術(shù)文獻(xiàn)速報(bào)》《工程索引》《地理學(xué)文摘》等等。
計(jì)算機(jī)文獻(xiàn)檢索論文篇三
文獻(xiàn)分類與檢索
【內(nèi)容提要】索引的研究、編制與文獻(xiàn)流通形式變化息息相關(guān)。以 計(jì)算機(jī)為主體的新技術(shù)在文獻(xiàn)流通領(lǐng)域廣泛 應(yīng)用,對(duì)索引理論研究及編制形成沖擊,同時(shí)也帶來(lái)變革的要求。10年來(lái)我國(guó)索引編制研究的起伏波動(dòng),說(shuō)明索引研究應(yīng)順應(yīng) 社會(huì)文獻(xiàn)流通需要而變革的重要性。書(shū)目編制、數(shù)據(jù)庫(kù)建設(shè)及文獻(xiàn)標(biāo)引、檢索 語(yǔ)言方面等研究的 發(fā)展趨勢(shì),也說(shuō)明新技術(shù)運(yùn)用對(duì)于文獻(xiàn)整理帶來(lái)的新特點(diǎn)、新要求。索引理論研究和編制要適應(yīng)新形勢(shì)、新情況,使索引編制更好地為社會(huì)服務(wù)。
索引是利用文獻(xiàn)的工具,與文獻(xiàn)流通形式的變化息息相關(guān)。10年來(lái)在索引編制理論研究方面發(fā)生了波動(dòng),說(shuō)明我們關(guān)于索引編制的理念正隨著文獻(xiàn)整理現(xiàn)代化進(jìn)步而發(fā)生深刻地變化。以往文獻(xiàn)以紙質(zhì)載體為主,索引編制靠人工,編排技術(shù)百多年沒(méi)有發(fā)生多大改變,理論研究相對(duì)穩(wěn)定。自從計(jì)算機(jī)及其相關(guān)電子技術(shù)應(yīng)用于文獻(xiàn)領(lǐng)域并成為新流通載體后,索引編制手段及索引形式發(fā)生了巨大變化,對(duì)傳統(tǒng)理念產(chǎn)生很大沖擊,這是造成索引研究波動(dòng)的根本原因。本文就10年(1993-2002)來(lái)索引研究的狀況進(jìn)行剖析,以求得一二看法,為索引研究深入發(fā)展籌謀。
1 索引理論研究低落,相關(guān)研究發(fā)展強(qiáng)勁
我國(guó)很早就有索引的編撰和理論研究。上世紀(jì)二三十年代,現(xiàn)代索引編制理論和方法傳到我國(guó),曾掀起索引編制和研究的高潮,成果輝煌。新中國(guó)建立后,安定的社會(huì) 環(huán)境,先進(jìn)的 政治制度,為學(xué)術(shù)研究提供了良好氛圍,索引的理論研究和編制才真正掀起高潮。雖然 “”影響了索引事業(yè)的發(fā)展,但撥亂反正后,索引研究與編制又蓬勃興起。尤其是80年代末期中國(guó)索引學(xué)會(huì)成立,領(lǐng)導(dǎo)索引研究, 組織索引開(kāi)發(fā),開(kāi)展學(xué)術(shù)交流,使我國(guó)索引事業(yè)走向規(guī)范化道路。
20世紀(jì)90年代初,是我國(guó)學(xué)術(shù)界研究索引理論的高峰期,1996年以后研究數(shù)量相對(duì)減少?!度珖?guó)報(bào)刊索引(哲社版)》報(bào)道的信息顯示了這種趨勢(shì)(見(jiàn)表1)。但這種滑動(dòng)并不表明我國(guó)索引研究衰退,而只能說(shuō)明傳統(tǒng)理論研究在減少,這是索引研究走向成熟的轉(zhuǎn)折。能說(shuō)明問(wèn)題的是與索引研究相關(guān)學(xué)科或索引應(yīng)用理論研究走向強(qiáng)勁。
表1 索引編制理論研究情況(按《全國(guó)報(bào)刊索引》報(bào)道時(shí)間 統(tǒng)計(jì))
年 代 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 共計(jì)
總 共 38 44 36 25 20 31 29 0 1 2 226
傳統(tǒng)編制 37 42 32 25 20 29 28 0 1 2 216
自動(dòng)化編制 1 2 4 0 0 2 1 0 0 0 10
1.1 書(shū)目的編制研究
書(shū)目編制在我國(guó)歷史悠久,從漢代劉向著《七略》麇集眾書(shū)始,書(shū)目便成為人們查檢文獻(xiàn)的重要工具。其六分群書(shū)并以此編排的方法,雖然有些幼稚,但已開(kāi)索引先河。書(shū)目對(duì)保存文獻(xiàn)并提供文獻(xiàn)利用的功能,在兩千多年歷史中影響巨大。書(shū)目功能雖然主要不是用于文獻(xiàn)查檢,可在漫長(zhǎng)歲月中人們主要靠書(shū)目來(lái)檢索文獻(xiàn),以至許多學(xué)者將索引理論在中國(guó)的不完善歸咎于書(shū)目的影響。直到現(xiàn)在關(guān)于書(shū)目編制的研究一直不衰。論述書(shū)目編制和數(shù)據(jù)庫(kù)的文獻(xiàn)就非常之多(不包括目錄學(xué)理論、各種目錄研究、圖書(shū)館編目及目錄組織等文章,見(jiàn)表2)。尤其是運(yùn)用自動(dòng)化手段編制書(shū)目的研究逐漸增強(qiáng)。
表2 書(shū)目編制理論及數(shù)據(jù)庫(kù)研究狀況(按《全國(guó)報(bào)刊索引》報(bào)道時(shí)間統(tǒng)計(jì))
年 代 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 共計(jì)
總 共 25 17 32 10 27 51 49 36 56 51 374
書(shū)目編制 11 6 11 2 5 16 4 9 12 12 88
傳統(tǒng)編制 11 5 10 2 4 8 4 6 8 6 64
自動(dòng)化編制 0 1 1 0 1 8 0 3 4 6 24
數(shù)據(jù)庫(kù)研究 3 5 10 6 17 49 41 18 32 27 208
1.2 書(shū)目數(shù)據(jù)庫(kù)建設(shè)研究
數(shù)據(jù)庫(kù)是計(jì)算機(jī)技術(shù)應(yīng)用于文獻(xiàn)存儲(chǔ)后的文獻(xiàn)形態(tài),大多數(shù)數(shù)據(jù)庫(kù)就是電子版的書(shū)目。其多種檢索途徑又使它成為一部多功能索引。對(duì)它的研究90年代初期較少,而末期達(dá)到高峰,至今不減(見(jiàn)表2)。
1.3 文獻(xiàn)標(biāo)引研究
文獻(xiàn)標(biāo)引是揭示文獻(xiàn)的途徑,書(shū)目和索引的編制都離不開(kāi)它。書(shū)目標(biāo)引在于揭示群書(shū)篇目,索引標(biāo)引所揭示的包括文獻(xiàn)提名在內(nèi)的各種知識(shí)點(diǎn)。在標(biāo)引技術(shù)上沒(méi)有本質(zhì)區(qū)別,對(duì)它的研究一直是常見(jiàn)的選題。10年來(lái)研究文章比較多(見(jiàn)表3,不包括圖書(shū)館分類、編目所涉及的標(biāo)引問(wèn)題)。計(jì)算機(jī)技術(shù)大規(guī)模運(yùn)用書(shū)目和索引編制以來(lái),討論自動(dòng)化標(biāo)引技術(shù)的文章越來(lái)越多,說(shuō)明我國(guó)文獻(xiàn)處理技術(shù)的研究已跟上世界發(fā)展的趨勢(shì)。
表3 文獻(xiàn)標(biāo)引研究情況(按《全國(guó)報(bào)刊索引》報(bào)道時(shí)間統(tǒng)計(jì))
年 代 1993 1994 1995 1996 1997 1998 1999 20
00 2001 2002 共計(jì)
總 共 28 39 34 26 46 64 48 28 50 39 402
傳統(tǒng)理論 22 36 29 21 42 49 36 16 33 29 313
自動(dòng)化標(biāo)引 6 3 5 5 4 15 12 12 17 10 89
1.4 文獻(xiàn)檢索語(yǔ)言研究
檢索語(yǔ)言是人與文獻(xiàn)對(duì)話的媒介,沒(méi)有這種語(yǔ)言就無(wú)法做到文獻(xiàn)規(guī)范化處理,就無(wú)法與文獻(xiàn)溝通。特別是計(jì)算機(jī)技術(shù)運(yùn)用以后,檢索語(yǔ)言成為人機(jī)對(duì)話的途徑。檢索語(yǔ)言是具有一定規(guī)范標(biāo)準(zhǔn)的人工語(yǔ)言。例如《中國(guó)圖書(shū)館圖書(shū)分類法》、《漢語(yǔ)主題詞表》、以及各種形式的“關(guān)鍵詞表”、“著者號(hào)碼表”等。如今人們又提出用自然語(yǔ)言標(biāo)引和檢索計(jì)算機(jī)整理的文獻(xiàn),研討熱烈,有許多文章頗有見(jiàn)地,代表了檢索語(yǔ)言的方向。如何在網(wǎng)絡(luò)環(huán)境下進(jìn)行文獻(xiàn)檢索的探討日益見(jiàn)多(見(jiàn)表4,數(shù)據(jù)不包括圖書(shū)館日常使用的分類法、主題法等)。
表4 文獻(xiàn)檢索語(yǔ)言研究狀況(按《全國(guó)報(bào)刊索引》報(bào)道時(shí)間統(tǒng)計(jì))
年 代 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 共計(jì)
總 共 15 37 25 16 41 29 25 35 37 19 279
傳統(tǒng)理論 15 35 24 15 38 25 21 27 29 11 240
自動(dòng)化語(yǔ)言 0 2 1 1 3 4 4 8 8 8 39
相關(guān)學(xué)科研究的強(qiáng)勁勢(shì)頭,是索引研究和編制的必然結(jié)果,是索引研究實(shí)用化的反映,也是索引科學(xué)與各學(xué)科交叉和融合的結(jié)果。它告示我們對(duì)應(yīng)用科學(xué)理論的探討更應(yīng)注重于實(shí)踐。
2 索引研究發(fā)展曲線描述了電子技術(shù)應(yīng)用文獻(xiàn)流通領(lǐng)域的歷程
10年中,關(guān)于索引編制、書(shū)目編制、書(shū)目數(shù)據(jù)庫(kù)、文獻(xiàn)標(biāo)引、檢索語(yǔ)言等研究,都經(jīng)歷了低→高→低的波動(dòng)。駝峰從1995年開(kāi)始至1999年,峰頂在1997-1998年。這正是以計(jì)算機(jī)為主體的現(xiàn)代電子技術(shù)在文獻(xiàn)出版、存儲(chǔ)、流通各環(huán)節(jié)普遍應(yīng)用時(shí)期。計(jì)算機(jī)網(wǎng)絡(luò)已成為人們實(shí)際使用的文獻(xiàn)形式。其功能齊全、傳播速度快、存儲(chǔ)量大、收藏豐富、檢索方便,準(zhǔn)確率高,都是紙質(zhì)文獻(xiàn)所不及,有替代書(shū)本式文獻(xiàn)之趨勢(shì)。在人們心理(接受新生事物)、生理(適應(yīng)并掌握操作技術(shù))上產(chǎn)生了解、掌握、運(yùn)用的欲望,因此關(guān)于新技術(shù)運(yùn)用的研究探討是必然現(xiàn)象。這種研究的熱化,勢(shì)必對(duì)傳統(tǒng)理論形成沖擊。但也要經(jīng)歷由淺入深、由一般介紹到深刻研究的進(jìn)程。隨著新技術(shù)的普及和運(yùn)轉(zhuǎn)穩(wěn)定后,該方面研究就會(huì)減少,因而形成曲線。這個(gè)曲線記錄著計(jì)算機(jī)及其網(wǎng)絡(luò)技術(shù)在文獻(xiàn)流通領(lǐng)域應(yīng)用的歷程。
2.1 計(jì)算機(jī)技術(shù)應(yīng)用對(duì)傳統(tǒng)索引理論研究的沖擊
1994年研究索引理論的文章最多,隨之逐漸減少(見(jiàn)表1)。與研究數(shù)據(jù)庫(kù)建設(shè)、文獻(xiàn)標(biāo)引技術(shù)和檢索語(yǔ)言的文章從1997年逐漸增多形成反差。形成這種反差的原因,就是學(xué)術(shù)界對(duì)計(jì)算機(jī)技術(shù)在文獻(xiàn)流通領(lǐng)域普遍應(yīng)用的反映與研究探討。1994-1996年是這類研究的醞釀、寫(xiě)作、發(fā)表周期。傳統(tǒng)理論逐漸減少合乎學(xué)術(shù)研究發(fā)展趨勢(shì),但“0”發(fā)展不正常,重視一種研究而忽視其他研究的傾向不可取。傳統(tǒng)索引編制理論是一切新索引編制和索引形式的理論基礎(chǔ),對(duì)其研究不可輕視。
2.2 書(shū)目數(shù)據(jù)庫(kù)研究的發(fā)展曲線(見(jiàn)圖1),明顯表明計(jì)算機(jī)及其網(wǎng)絡(luò)在圖書(shū)館和其他文獻(xiàn)傳播行業(yè)中運(yùn)用的過(guò)程
關(guān)于數(shù)據(jù)庫(kù)研究的文章始見(jiàn)于80年代末90年代初,主要以介紹其功能作用為主。隨著計(jì)算機(jī)在文獻(xiàn)流通領(lǐng)域普及速度加快,文章數(shù)量開(kāi)始增多,探討數(shù)據(jù)庫(kù)編制、檢索以及制作技術(shù)等方面內(nèi)容。1995年以后研究文章開(kāi)始驟增,標(biāo)志著計(jì)算機(jī)在以圖書(shū)館為主體的文獻(xiàn)流通領(lǐng)域大規(guī)模應(yīng)用。之后的三四年是計(jì)算機(jī)及其網(wǎng)絡(luò)技術(shù)普及應(yīng)用的高峰,至90年代末基本穩(wěn)定,于是研究的文章相對(duì)減少。
附圖
圖1 文獻(xiàn)標(biāo)引、檢索語(yǔ)言、書(shū)目數(shù)據(jù)庫(kù)研究情況示意圖
2.3 文獻(xiàn)標(biāo)引的研究與檢索語(yǔ)言的研究相依共存,都是揭示文獻(xiàn)的方式和手段
檢索語(yǔ)言是人與文獻(xiàn)載體(印刷體、電子形式等)溝通的語(yǔ)言,通過(guò)這種語(yǔ)言或代表這種語(yǔ)言的標(biāo)識(shí)符號(hào),把文獻(xiàn)主體概念及其他有檢索意義的特征表示出來(lái),作為文獻(xiàn)存儲(chǔ)和檢索的依據(jù)。沒(méi)有檢索語(yǔ)言,標(biāo)引無(wú)法做到。不進(jìn)行標(biāo)引,檢索語(yǔ)言便毫無(wú)用處。這是索引編制的重要途徑。尤其是計(jì)算機(jī)技術(shù)應(yīng)用于文獻(xiàn)整理后,這兩方面的研究尤為需要。從圖1可以看出,研究的高峰恰恰也在計(jì)算機(jī)技術(shù)普遍應(yīng)用時(shí)期,表明了學(xué)術(shù)界對(duì)文獻(xiàn)標(biāo)引及其檢索語(yǔ)言編制的重視,同時(shí)也反映出這些學(xué)者與時(shí)俱進(jìn)的學(xué)風(fēng)和進(jìn)取精神。計(jì)算機(jī)應(yīng)用是索引理論研究史上最重大的事件,它不僅隨著文獻(xiàn)載體轉(zhuǎn)變而變換其形態(tài),而且關(guān)系到編制方法、操作過(guò)程等環(huán)節(jié)的改革與創(chuàng)新,更重要是索引編制的觀念必須改變。這是索引編制史上一場(chǎng)重大的革命。
3 索引理論研究步伐不大但視野開(kāi)闊
索引研究在眾學(xué)科中是小字輩,成果相對(duì)較少。研究?jī)?nèi)容大都屬于功能介紹、編制方法等探討。隨著科學(xué)研究深入 發(fā)展,人們對(duì)文獻(xiàn)需求廣泛,索引理論研究便向著多元化、專深化發(fā)展。特別是新型文獻(xiàn)載體的出現(xiàn),開(kāi)闊了索引理論研究的眼界。人們從多角度多方面探求揭示文獻(xiàn)的途徑,10年來(lái)總體研究步伐邁得不大,但研究視野比以前開(kāi)闊了許多,這本身就是索引理論研究的進(jìn)步。
3.1 總體趨勢(shì)是傳統(tǒng)理論研究在減少,但反映的是對(duì)新形勢(shì)下索引研究的呼喚
索引理論研究在90年代還很穩(wěn)定。表1中1993-1999年間研究文章數(shù)量起伏不大,而且較多。說(shuō)明我國(guó)學(xué)術(shù)界中有一批學(xué)者在關(guān)心索引事業(yè)的發(fā)展。在這較好的氛圍中,中國(guó)索引學(xué)會(huì)功不可沒(méi), 組織學(xué)術(shù)研究,與國(guó)內(nèi)外學(xué)界交流互通,做了許多 工作。在90年代中期,中國(guó)索引學(xué)會(huì)編輯了《索引研究論從》叢書(shū),包括《索引的昨天與明天》、《索引技術(shù)和索引標(biāo)準(zhǔn)》、《論索引和索引方法》、《報(bào)紙索引和新聞數(shù)據(jù)庫(kù)》、《索引編制自動(dòng)化》5個(gè)分冊(cè),共收 論文114篇,聘請(qǐng)相關(guān)專家撰寫(xiě)了有關(guān)索引編制原理及自動(dòng)化編制技術(shù)、文獻(xiàn)標(biāo)引及自動(dòng)化標(biāo)引技術(shù)、檢索 語(yǔ)言編制及 計(jì)算機(jī)語(yǔ)言識(shí)別技術(shù)、書(shū)目數(shù)據(jù)庫(kù)技術(shù)等方面的論文,論及問(wèn)題之深,引用資料之多,學(xué)術(shù)見(jiàn)解之新,是索引理論研究多年未曾有過(guò)的,為中國(guó)索引理論發(fā)展起了導(dǎo)航作用。但近幾年研究文章驟減的狀況應(yīng)該引起學(xué)術(shù)界注意,反思以往的研究是否適于新形勢(shì)、新局面的需要,如何盡快改變傳統(tǒng)觀念,建立起新技術(shù)研究體系等,為 網(wǎng)絡(luò) 環(huán)境下索引事業(yè)的發(fā)展奠定基礎(chǔ)。
3.2 索引研究視野逐步擴(kuò)大,適應(yīng)了科學(xué)技術(shù)發(fā)展的大趨勢(shì)
10年間報(bào)刊上共 發(fā)表研究索引編制理論的文章203篇(這個(gè)數(shù)字是按原始文獻(xiàn)發(fā)表時(shí)間 統(tǒng)計(jì)),內(nèi)容包括索引編制的一般理論、自動(dòng)化編制、國(guó)外索引編制、各種類型索引研究、索引史研究、對(duì)著名索引學(xué)者和編制機(jī)構(gòu)研究、索引專著研究、各種檢索工具索引編制、古籍和現(xiàn)代著作索引編制等(見(jiàn)表5)。一般理論研究只占31.5%,其他專門研究占2/3還強(qiáng)。在64篇理論文章中談功能作用類27篇,編制原理類26篇,論索引事業(yè)發(fā)展8篇,對(duì)中外索引編制理論進(jìn)行比較研究的3篇。從各種角度來(lái)研究索引編制,反映出索引研究的生命力,能夠適應(yīng)科學(xué)技術(shù)進(jìn)步而發(fā)展。
表5 1993-2002索引理論研究分類狀況(按原始文獻(xiàn)發(fā)表時(shí)間統(tǒng)計(jì))
項(xiàng) 一般 自動(dòng) 國(guó)外 索引 學(xué)者 索引 索引 檢索 古籍 現(xiàn)代 總
目 研究 化 索引 類型 機(jī)構(gòu) 史 專著 工具 索引 著作 共
數(shù)量 64 12 13 62 6 7 22 10 3 4 203
3.3 索引類型的研究數(shù)量較多,表明了索引學(xué)仍是一門實(shí)用科學(xué)
只要社會(huì)需要文獻(xiàn)就有使用索引的要求。不論什么時(shí)候索引都是使用文獻(xiàn)最便捷的途徑。研究各種類型索引編制的文章62篇,幾乎占1/3,論述了10多種索引的編制(見(jiàn)表6)。雖然平均文章不多,但反映出學(xué)術(shù)界給予的關(guān)注。這些索引功用不同,但都是人們所需要的。
表6 類型索引研究情況(按原始文獻(xiàn)發(fā)表時(shí)間統(tǒng)計(jì))
附圖
3.4 計(jì)算機(jī)技術(shù)趨于穩(wěn)定后,自動(dòng)化方面的研究會(huì)減少,而研究索引類型、為學(xué)術(shù)著作編制索引會(huì)增多
新文獻(xiàn)載體出現(xiàn),文獻(xiàn)利用形式發(fā)生變化,對(duì)這方面的研究必然要出現(xiàn),但一旦普及并趨于穩(wěn)定后,介紹或說(shuō)明性文章就會(huì)減少,而逐漸轉(zhuǎn)向深層次探討,文章數(shù)量就要下落。研討數(shù)據(jù)庫(kù)文章逐漸減少就是例證。而在書(shū)目編制、文獻(xiàn)標(biāo)引、文獻(xiàn)編排、檢索語(yǔ)言等領(lǐng)域自動(dòng)化研究逐漸增多則表明人們正在擺脫一般理論的研究,轉(zhuǎn)向?qū)嵱美碚摗iT編制方法的探討。這也是計(jì)算機(jī)技術(shù)從應(yīng)用到理論研究進(jìn)展的過(guò)程。因此研究計(jì)算機(jī)應(yīng)用于具體領(lǐng)域的文章會(huì)逐漸增多,逐步加深。
3.5 對(duì)索引史、索引研究與編制方面有貢獻(xiàn)的學(xué)者或機(jī)構(gòu)的研究逐漸減少,而對(duì)索引著作和檢索工具索引編制研究的增多,反映出學(xué)術(shù)界更重視索引應(yīng)用理論的研究,重視索引檢索功能的探討
雖然近3年這方面研究出現(xiàn)空白,但是暫時(shí)現(xiàn)象,是由于文獻(xiàn)載體變換中出現(xiàn)的調(diào)整期。當(dāng)計(jì)算機(jī)技術(shù)運(yùn)行穩(wěn)定后,由于機(jī)編速度快、抽詞準(zhǔn)確、編排規(guī)范等優(yōu)點(diǎn),節(jié)省大量編制成本和人工,勢(shì)必會(huì)出現(xiàn)編撰索引的高潮。包括為古今中外各種學(xué)術(shù)研究而編制索引。索引成果不一定是印刷型,但功能一樣。
只要文獻(xiàn)功能沒(méi)有消失,索引作用就不會(huì)消亡。從索引功利性能上講,計(jì)算機(jī)在文獻(xiàn)領(lǐng)域里廣泛運(yùn)用,為索引編制開(kāi)辟了無(wú)限光明的前景,以往可望不可及的鴻篇巨著的索引編制,如今可能在俄傾之間,輕松愉快之中成就。文獻(xiàn)使用步入了嶄新的時(shí)代。
4 走出“理論”的困惑,建立大索引觀,放眼于索引的實(shí)際應(yīng)用
索引是“完備文獻(xiàn)”的重要組成部分,“完備文獻(xiàn)”應(yīng)該是既有原始文獻(xiàn)又兼有檢索工具,使用起來(lái)非常方便。索引就是檢索工具,依附于文獻(xiàn)而存在。如今文獻(xiàn)形態(tài)發(fā)生了巨大變化,索引研究也要洗心革面,使其適應(yīng)新形勢(shì)下人們對(duì)文獻(xiàn)的需求。就索引研究的現(xiàn)狀有幾方面應(yīng)引起我們重視。
4.1 應(yīng)突破傳統(tǒng)觀念的束縛,樹(shù)立創(chuàng)新思維
深刻研究當(dāng)今人們利用文獻(xiàn)的特點(diǎn),研究計(jì)算機(jī)及其網(wǎng)絡(luò)發(fā)展對(duì)文獻(xiàn)傳播的影響,網(wǎng)絡(luò)環(huán)境下人們對(duì)文獻(xiàn)使用的需求,以使索引編制適應(yīng)人們未來(lái)利用文獻(xiàn)的需要。索引理論研究既要適應(yīng)文獻(xiàn)形式變化,也應(yīng)符合人們對(duì)所用文獻(xiàn)的了解認(rèn)知、心理適應(yīng)和使用習(xí)慣。不能固守傳統(tǒng)理論不放,理論與實(shí)用脫節(jié),而失去指導(dǎo)實(shí)踐的意義。建立創(chuàng)新思維,不能指望在短時(shí)間建立一套完備的新理論,應(yīng)該樹(shù)立新的思維方式方法,敢于創(chuàng)新,敢于超前,以社會(huì)需求為研究目的,充分發(fā)揮索引在揭示文獻(xiàn)上的作用,為文獻(xiàn)利用提供快車道。
4.2 沖破“太平研究”的藩籬,增強(qiáng)其理性探索
現(xiàn)在許多研究是以發(fā)表文章為第一需要,所以在理論探討上,都愿說(shuō)“套話”,打“貫腔”,生怕新東西叫不準(zhǔn),新提法不被編輯認(rèn)同,因此眾云亦云,以求太平。還有個(gè)傾向,不論什么樣內(nèi)容都把它寫(xiě)成“理論”型,帶有“理論”味,把特征、規(guī)律、功能等大談一番。這實(shí)不可取。理論研究就是為了解決實(shí)際問(wèn)題,不要拘于一定的形式,內(nèi)容深淺皆可,只要論述明白一個(gè)問(wèn)題就是好文章。索引是一門實(shí)用科學(xué),應(yīng)注重編撰技術(shù)的研究與探討。可在10年中關(guān)于書(shū)目、索引編排技術(shù)(不包括圖書(shū)館目錄組織)的研究只有44篇(見(jiàn)表7),這個(gè)數(shù)量是討論索引編制和書(shū)目編制理論314篇文章(見(jiàn)表1、2)的14%,占這次在《全國(guó)報(bào)刊索引》查閱1 247條信息的3.5%,表明對(duì)編制技術(shù)方面的忽視。重“理論”,輕技術(shù),是理性不足的顯現(xiàn)。反映出業(yè)界習(xí)慣于約定俗成的運(yùn)作,不善于開(kāi)發(fā)與創(chuàng)新。
表7 關(guān)于書(shū)目索引編排技術(shù)研究(按《全國(guó)報(bào)刊索引》報(bào)道時(shí)間統(tǒng)計(jì))
年代 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 共計(jì)
總共 4 2 5 5 3 6 2 6 2 9 44
傳統(tǒng) 3 2 3 4 2 3 0 4 1 2 24
自動(dòng)化 1 0 2 1 1 3 2 2 1 7 20
4.3 相當(dāng)研究人員對(duì)先進(jìn)技術(shù)了解不足,對(duì)索引未來(lái)發(fā)展認(rèn)識(shí)模糊
表1中研究傳統(tǒng)理念數(shù)量與研究自動(dòng)化編制之比為216:10,不能不說(shuō)明學(xué)術(shù)界對(duì)新技術(shù)反映生疏。許多選題和論述,都不談?dòng)?jì)算機(jī)運(yùn)用于文獻(xiàn)整理后產(chǎn)生的影響,而談那些已被許多人談過(guò)的問(wèn)題。這是因?yàn)閷?duì)新技術(shù)運(yùn)用不甚了解,自然就不會(huì)對(duì)未來(lái)發(fā)展有清醒認(rèn)識(shí)。90年代初期計(jì)算機(jī)在我國(guó)應(yīng)用較少,而西方先進(jìn)國(guó)家已大規(guī)模使用,這時(shí)理論界就應(yīng)有個(gè)介紹的高潮,可實(shí)際上這種文
章很少。說(shuō)明我國(guó)索引界對(duì)新技術(shù)應(yīng)用反映不夠,學(xué)術(shù)研究相對(duì)滯后。這種局面必須改變,不然的話我們索引研究與編制就會(huì)落伍,就會(huì)影響國(guó)家和民族科學(xué)文化事業(yè)的發(fā)展。
4.4 首先要深刻了解日新月異的新技術(shù)帶來(lái)的挑戰(zhàn),需要我們不時(shí)地更新、探索、追求,才能跟上時(shí)代的步伐,才能為文獻(xiàn)充分服務(wù)于社會(huì)保駕護(hù)航
要根據(jù)新形勢(shì)下社會(huì)對(duì)文獻(xiàn)的需要,開(kāi)發(fā)出實(shí)用性強(qiáng)的索引產(chǎn)品,為社會(huì)服務(wù)。索引研究和編制要因時(shí)、因書(shū)、因人、因社會(huì)需求而宜,真能如此,社會(huì)怎不認(rèn)同。
4.5 理論研究要與時(shí)俱進(jìn),與實(shí)踐相結(jié)合,以社會(huì)實(shí)際需要為前提
對(duì)于原理的討論是必須的,而專門編撰理論的研究更為重要。索引編制不順應(yīng)時(shí)代,脫離實(shí)際需求,就分文不值。要形成良好的研究氛圍,建立需求→研究→新需求→新研究的機(jī)制,研究有針對(duì)性也就有了生命力。編制方法有了科學(xué)性,索引成果就會(huì)產(chǎn)生很大的社會(huì)效益。
4.6 樹(shù)立大索引觀,開(kāi)闊研究領(lǐng)域,為振興國(guó)家的科學(xué)、技術(shù)、文化及經(jīng)濟(jì)建設(shè)服務(wù)
一不能把眼光局限于印刷型文獻(xiàn),雖然電子型文獻(xiàn)目前人們不常見(jiàn),但它終會(huì)成為文獻(xiàn)主流載體,所以要加強(qiáng)數(shù)據(jù)庫(kù)檢索方式方法研究的力度,使電子文獻(xiàn)更科學(xué)的為人們服務(wù)。二不能只重視社會(huì)科學(xué)方面文獻(xiàn)的索引編制,要把眼界擴(kuò)展為流通于整個(gè)社會(huì)的文獻(xiàn),比如經(jīng)濟(jì)建設(shè)、工業(yè)生產(chǎn)、商業(yè)服務(wù)業(yè)等方面,凡是能通過(guò)整序而流通于社會(huì)的文獻(xiàn),或者說(shuō)通過(guò)整序后有利于社會(huì)流通的文獻(xiàn),都應(yīng)該納入我們的視野。比如產(chǎn)業(yè)名錄、商品名錄等。三要注重與索引研究交叉學(xué)科的研究,這些學(xué)科間研究目的相近,技術(shù)相關(guān),功能相連。諸如文獻(xiàn)的分類、編目、標(biāo)引、校仇、考證以及數(shù)據(jù)庫(kù)制作技術(shù)等。雖然整理目的不同,但許多技術(shù)相近,可以相互利用,共同完成文獻(xiàn)的揭示與整理。
4.7 中國(guó)索引學(xué)會(huì)應(yīng)加強(qiáng)力量引導(dǎo)學(xué)術(shù)研究
除組織學(xué)術(shù)活動(dòng)外,更應(yīng)該在索引理論研究方向上起導(dǎo)向作用,介紹世界上先進(jìn)的編制技術(shù)和索引研究動(dòng)態(tài),引進(jìn)成果,翻譯有影響的學(xué)術(shù)著作,加強(qiáng)學(xué)術(shù)交流,使社會(huì)各界了解索引的新發(fā)展。學(xué)會(huì)也應(yīng)吸收工商界有關(guān)技術(shù)人員參加,使索引研究更加實(shí)用化,直接與工農(nóng)業(yè)生產(chǎn)和國(guó)家的經(jīng)濟(jì)建設(shè)掛鉤,更好地服務(wù)于國(guó)民經(jīng)濟(jì)建設(shè)。
總之,10年來(lái)索引研究有喜也有憂,憂中也有喜。喜,研究成果頗豐。憂,后幾年傳統(tǒng)研究滑坡。滑坡的原因是社會(huì)對(duì)新技術(shù)廣泛應(yīng)用的關(guān)注,人們要有個(gè)了解熟悉的過(guò)程。在這個(gè)過(guò)程中,人們會(huì)對(duì)傳統(tǒng)技術(shù)進(jìn)行重新審視、評(píng)價(jià)、借鑒并與新技術(shù)融會(huì)。后幾年傳統(tǒng)研究減少就是新舊技術(shù)融會(huì)調(diào)整的時(shí)期。今后定會(huì)出現(xiàn)個(gè)新理論蓬勃發(fā)展期,因此憂中又有喜。讓我們做好理論準(zhǔn)備,迎接新索引編制高潮的到來(lái)。
【參考文獻(xiàn)】
1 《全國(guó)報(bào)刊索引(哲社版)》,1993-2002年
2 侯漢清主編.索引技術(shù)和索引標(biāo)準(zhǔn).北京:北京圖書(shū)館出版社,1997
3 葛永慶主編.索引的昨天今天和明天.中國(guó)索引學(xué)會(huì)出版.1994
4 葛永慶主編.論索引和索引法.中國(guó)索引學(xué)會(huì)出版,1994
5 葛永慶主編.索引工作自動(dòng)化.中國(guó)索引學(xué)會(huì)出版,1994
6 葛永慶主編.報(bào)紙索引和新聞數(shù)據(jù)庫(kù).中國(guó)索引學(xué)會(huì)出版,1999
有關(guān)計(jì)算機(jī)文獻(xiàn)檢索論文推薦: