六月丁香五月婷婷,丁香五月婷婷网,欧美激情网站,日本护士xxxx,禁止18岁天天操夜夜操,18岁禁止1000免费,国产福利无码一区色费

學習啦 > 論文大全 > 畢業(yè)論文 > 醫(yī)藥學論文 > 藥學 > 構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜的探討論文

構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜的探討論文

時間: 謝樺657 分享

構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜的探討論文

  中醫(yī)藥數(shù)據(jù)庫建設工作起源于1985年,數(shù)據(jù)庫資源的詳細描述與統(tǒng)一管理,包括數(shù)據(jù)庫元數(shù)據(jù)管理、每個中醫(yī)藥相關的數(shù)據(jù)庫涉及表的管理、每個表的數(shù)據(jù)元管理3個部分。今天學習啦小編要與大家分享:構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜的探討相關論文,具體內(nèi)容如下,歡迎閱讀:

  【關鍵詞】 中醫(yī)藥信息學;數(shù)據(jù)資源;數(shù)據(jù)結(jié)構(gòu)整合

構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜的探討

  本研究通過分析中醫(yī)藥數(shù)據(jù)庫資源的類型、特點和中醫(yī)藥資源存在的問題,提出基于現(xiàn)有數(shù)據(jù)庫資源與結(jié)構(gòu),參考現(xiàn)有資源整合技術,從數(shù)據(jù)層、物理層、基礎層3個方面入手,并結(jié)合體系構(gòu)建等相關的資源深層整合技術,探討構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜的實際解決方案。

  1 中醫(yī)藥數(shù)據(jù)資源現(xiàn)狀與問題

  中醫(yī)藥數(shù)據(jù)庫建設工作起源于1985年,目前,已經(jīng)建立了覆蓋中醫(yī)藥學科的復雜的多類型數(shù)據(jù)庫,總數(shù)據(jù)量約200 G,文獻數(shù)據(jù)庫收集年代跨越58年。數(shù)據(jù)庫建設主要包括單表數(shù)據(jù)庫、結(jié)構(gòu)性數(shù)據(jù)庫和數(shù)據(jù)平臺的建設。目前,中醫(yī)藥現(xiàn)代資源數(shù)據(jù)庫的建設已經(jīng)具有一定的規(guī)模,已經(jīng)形成以中醫(yī)藥科學數(shù)據(jù)中心與分中心為主體的中醫(yī)藥文獻型及事實型數(shù)據(jù)庫群,幾乎涉及到中醫(yī)藥信息的方方面面。 然而這些資源庫群是徹底異構(gòu)的,從數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng),到數(shù)據(jù)庫系統(tǒng)、應用系統(tǒng);從命名方式,到數(shù)據(jù)格式、結(jié)構(gòu)模型、用戶界面,都有可能完全不同,目前還沒有標準規(guī)范能夠?qū)@個各個層次的異構(gòu)進行適當?shù)募s束

  中醫(yī)藥科學數(shù)據(jù)中心缺少完整解決方案。1.1 局部有序、整體無序 從某一種具體資源的角度來看,他們都是經(jīng)過一定程度加工整序,具有統(tǒng)一的分類體系和檢索界面。但從全局的角度來,中醫(yī)藥科學數(shù)據(jù)中心擁有的各種資源是一個個的“信息孤島”, 各種資源內(nèi)容交叉,信息重復,關聯(lián)度低,用戶查找資料時不但要在多個數(shù)據(jù)庫中來回穿梭、重復操作,還要精通各種不同數(shù)據(jù)庫、不同界面的數(shù)字資源系統(tǒng)檢索技術,否則便難以查全或查準所需要的資料。

  1.2 數(shù)據(jù)結(jié)構(gòu)與標準不統(tǒng)一

  各種不同類型的數(shù)字資源不但采用Oracle、mySQL、SQL、Access等不同的數(shù)據(jù)庫物理模型或半結(jié)構(gòu)、非結(jié)構(gòu)的數(shù)據(jù)結(jié)構(gòu),而且在對資源的描述與揭示時沒有采用元數(shù)據(jù)、數(shù)據(jù)元、數(shù)據(jù)模式等標準。數(shù)據(jù)庫字段與數(shù)據(jù)表命名差異性較大,例如:“ZZ”表名對應數(shù)據(jù)字段名就有“主治”、“著作”、“作者”等。

  1.3 數(shù)據(jù)來源多途徑與數(shù)據(jù)版本復雜

  中醫(yī)藥數(shù)據(jù)資源是指中醫(yī)藥科學數(shù)據(jù)中心與分中心收集的各類型專業(yè)數(shù)據(jù),這部分資源數(shù)量眾多,構(gòu)成了學術數(shù)字資源的主體,現(xiàn)已成為重要的文獻來源。從文獻類型上看,有期刊、圖書、會議論文、學位論文等;從文獻級別上看,有題錄、文摘、全文等不同的層次。自建數(shù)據(jù)庫有多種載體、多種形式、多種類型、分散異構(gòu)的信息資源,這些數(shù)據(jù)庫形成時間長,數(shù)據(jù)更新多次,缺少清晰的資源定義與描述。

  1.4 系統(tǒng)平臺與應用程序各異

  各種不同類型的數(shù)字資源有著不同的系統(tǒng)平臺;不同的數(shù)據(jù)資源存在著過程數(shù)據(jù)的不同服務方式,例如:期刊文獻數(shù)據(jù)庫、結(jié)構(gòu)型文獻數(shù)據(jù)庫、分析結(jié)構(gòu)型文獻數(shù)據(jù)庫;同時,數(shù)據(jù)表存在著基礎數(shù)據(jù)庫、粗表數(shù)據(jù)庫、細表數(shù)據(jù)庫、單元素數(shù)據(jù)庫等,部署在共建、共享的服務器上,也給數(shù)據(jù)管理帶來麻煩。

  2 數(shù)據(jù)資源與結(jié)構(gòu)整合技術

  2.1 數(shù)據(jù)資源整合

  整合的實質(zhì)就是各個單獨事物共同遵循統(tǒng)一的原則、標準、規(guī)定,打破原來的界限形成有機的統(tǒng)一體。數(shù)據(jù)資源的整合[1],英文可譯作“digital resource integration”,就是通過各種手段和工具將已有的信息資源集成起來,并按照一定的邏輯關系進行組織,實現(xiàn)信息資源的有效共享,為用戶提供條理化的信息服務,為后續(xù)信息的管理與使用提供規(guī)范,從而實現(xiàn)信息的增值利用。

  數(shù)字資源整合主要集中在數(shù)據(jù)集的整合和應用的整合兩個方面,再具體細分還可以劃分為數(shù)據(jù)集成、信息集成、信息系統(tǒng)集成及業(yè)務(或工作流)集成等4個階段。

  通常數(shù)據(jù)資源整合的范圍可以包括4個方面。①數(shù)據(jù)整合:數(shù)據(jù)標準、主題數(shù)據(jù)庫、數(shù)據(jù)交換平臺、基于語義的全局數(shù)據(jù)視圖。②應用整合:使用統(tǒng)一用戶認證、使用統(tǒng)一的數(shù)據(jù)交換、使用門戶實現(xiàn)應用集成。③內(nèi)容整合:信息規(guī)劃、信息導航、統(tǒng)一搜索、信息專題、信息門戶。④流程整合:統(tǒng)一數(shù)據(jù)采集加工處理流程、統(tǒng)一數(shù)據(jù)存儲管理、統(tǒng)一數(shù)據(jù)訪問和調(diào)用接口。

  信息資源整合根據(jù)系統(tǒng)論的原則,依據(jù)一定的需要,對各個相對獨立系統(tǒng)中的數(shù)據(jù)對象、功能結(jié)構(gòu)及互動關系進行融合、類聚和重組,重新構(gòu)建一個新的有機整體,形成一個效能更好、效率更高的新的信息資源系統(tǒng)。目前,數(shù)字資源整合的方式主要包括:基于OPAC資源系統(tǒng)的整合、基于數(shù)字資源導航的整合、基于異構(gòu)數(shù)據(jù)庫跨庫檢索的整合、基于數(shù)字圖書館應用系統(tǒng)的整合等。

  2.2 數(shù)據(jù)資源整合技術

  2.2.1 DOI技術

  DOI(Digital Object Identifier)由International DOI Foundation組織構(gòu)造。該系統(tǒng)提供了一個框架,為數(shù)字環(huán)境中的數(shù)字對象分配唯一的、永久性的標識,方便該對象被管理和使用。DOI系統(tǒng)由4部分構(gòu)成:申請DOI;創(chuàng)建對指定DOI對象的描述;解析系統(tǒng);規(guī)則。

  2.2.2 SFX技術

  SFX即Special Effects Cinematography,它是比利時根特大學的薩姆堡爾為首的研究小組提出的。通過Open URL框架把復雜的數(shù)據(jù)庫之間的互連通過簡單的鏈接完成。

  2.2.3 Web Services技術

  Web Service是為實現(xiàn)“基于web無縫集成”的目標而提出的全新概念,希望通過Web Service能夠?qū)崿F(xiàn)不同的系統(tǒng)之間能夠用“軟件-軟件對話”的方式相互調(diào)用,打破軟件應用、網(wǎng)站和各種設備之間格格不入的狀態(tài)。

  2.2.4 地域性索引服務平臺技術

  A.N.ZINCIR-HEYWOOD提出一個地域性索引服務平臺(Domain Index Server),建議依靠一個索引代理去創(chuàng)建成主要的原文獻索引,這個代理通常是軟件系統(tǒng),能夠在異構(gòu)信息支撐下自動行動(搜索)的系統(tǒng)。

  2.2.5 MAP資源整合系統(tǒng)

  INNOPAC公司推出的MAP (Millennium Access Plus)是一個集成的資源整合系統(tǒng),它可實現(xiàn)不同信息資源的動態(tài)鏈接。這些資源包括全文電子資源、題錄和文摘數(shù)據(jù)庫、書目數(shù)據(jù)庫、圖書館在線書目系統(tǒng)、圖像數(shù)據(jù)庫及搜索引擎等其他Web資源。

  2.2.6 OAI標準整合模式

  OAI是指open archives initiative,它的目標是發(fā)展和促進互操作標準,促進內(nèi)容數(shù)據(jù)的有效傳播。①數(shù)據(jù)提供者:提供元數(shù)據(jù)的Web服務器。②服務提供者:向數(shù)據(jù)提供者發(fā)出請求并且利用得到的元數(shù)據(jù)構(gòu)建增值服務。③存儲體:由數(shù)據(jù)提供者管理的可以在網(wǎng)上訪問的服務器,它提供服務提供者需要采集的元數(shù)據(jù)。④采集器:在服務提供者方作為從存儲體中搜集元數(shù)據(jù)的一種應用工具。

  2.2.7 情報源圖譜

  美國國立醫(yī)學圖書館主持了一項長期研究和開發(fā)計劃,即統(tǒng)一醫(yī)學語言系統(tǒng)(UMLS),其項目中有一個是關于生物醫(yī)學機讀信息資源的情報源圖譜,其目的是利用超級敘詞表和語義網(wǎng)絡實現(xiàn)情報源與特定提問的相關性;有效組織信息資源,為用戶提供特定信息源的范圍、功能和檢索條件等人工可讀的信息;自動連接相關信息源;在一個或多個情報源中自動檢索并自動組織檢索的結(jié)果。

  3 構(gòu)建中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜

  3.1 中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜框架(見圖1)

  3.2 中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜內(nèi)容

  3.2.1 物理層

  系統(tǒng)運行的硬件、軟件環(huán)境,解決如何為應用系統(tǒng)提供統(tǒng)一的支撐環(huán)境,支持應用系統(tǒng)的運作。

  3.2.2 基礎層

  位于物理互連的網(wǎng)絡協(xié)議之上,用于標準化、規(guī)范化描述數(shù)據(jù),為更上層的數(shù)據(jù)交換提供基礎性支持的標準、規(guī)范。基礎性協(xié)議標準又可以劃分為數(shù)據(jù)描述層面和數(shù)據(jù)訪問層面。前者主要包括元數(shù)據(jù)、XML、RSS,后者主要包括開放數(shù)據(jù)庫互連標準(ODBC)等。在數(shù)據(jù)描述層面內(nèi)部,RSS具有提供內(nèi)容聚合的功能,是為實現(xiàn)內(nèi)容聚合而制定的一種信息描述、組織的規(guī)范,但它也具有資源發(fā)現(xiàn)、發(fā)布的功能,更是一種新形式的描述規(guī)則。因此,將RSS歸入基礎的描述層面標準。準確的說,RSS本身也是基于XML格式的,其實是XML成功應用的一個典型。從這一層總體來看,這些基礎的標準、規(guī)范(除了RSS之外),大多數(shù)都不是專門為解決資源整合的問題而制定的,主要是從信息組織、跨異構(gòu)數(shù)據(jù)庫的互連、互訪用途出發(fā)的。但是,它們確為更好地實現(xiàn)資源整合提供了有力的支持。

  3.2.3 數(shù)據(jù)層整合

  旨在屏蔽各數(shù)據(jù)源異構(gòu)性,使得各數(shù)據(jù)源之間能夠進行數(shù)據(jù)的交換與交互,令用戶可透明地訪問多個數(shù)據(jù)源。要實現(xiàn)數(shù)據(jù)整合,必須對數(shù)據(jù)進行跨數(shù)據(jù)源的收集、組織、處理與集成。根據(jù)整合系統(tǒng)與數(shù)據(jù)源之間交互的特點,又可以分為3種形式:基于聯(lián)邦的整合、基于采集的整合、基于鏈接的整合;數(shù)據(jù)層整合協(xié)議的重點是解決系統(tǒng)之間的數(shù)據(jù)交換和數(shù)據(jù)交互。

  整合揭示以下功能。①不同文獻層次、級別的指引關系:題錄信息→標引信息→文摘信息→全文→結(jié)構(gòu)信息,一次文獻和二次文獻之間的對應聯(lián)系。②中心數(shù)字資源和網(wǎng)絡數(shù)字資源之間的交叉、重復和互補關系:全文數(shù)據(jù)庫與中心文獻相重復的部分;又如PUBMED的生物醫(yī)學資源中的期刊包括絕大多數(shù)的館藏期刊,并提供了大部分題錄和部分免費全文。③數(shù)字資源之間的主題相關或?qū)W科相關,內(nèi)容上的重合和互補關系:引用和被引用及共同引用的關系,說明資源在內(nèi)容上的相互關聯(lián)。④數(shù)字資源與服務之間的關系:共建資源與服務資源之間存在密切聯(lián)系,但因服務層次需求分為全文、結(jié)構(gòu)、粗表、細表、分析表等資源。

  3.2.4 具體整合要求

  數(shù)據(jù)庫資源的詳細描述與統(tǒng)一管理,包括數(shù)據(jù)庫元數(shù)據(jù)管理、每個中醫(yī)藥相關的數(shù)據(jù)庫涉及表的管理、每個表的數(shù)據(jù)元管理3個部分。數(shù)據(jù)庫的元數(shù)據(jù)管理需要對數(shù)據(jù)制作相關的信息如制作人、起始日期、制作背景、目標、更新周期等信息進行管理,并可以使用中醫(yī)藥的分類詞表對數(shù)據(jù)庫進行描述;表的數(shù)據(jù)元管理需要指明字段的名稱、類型、大小、取值范圍以及所對應的標準。此外,多個數(shù)據(jù)庫之間也存在一定的關系,如方劑數(shù)據(jù)相關的數(shù)據(jù)庫,就有中國方劑數(shù)據(jù)庫、方劑現(xiàn)代應用數(shù)據(jù)庫等,對于方劑類數(shù)據(jù)庫需要制定統(tǒng)一的方劑數(shù)據(jù)庫制作標準,并對這些庫之間的關系進行描述。

  要求研制管理工具,能夠增、刪改每個數(shù)據(jù)庫的元數(shù)據(jù)、數(shù)據(jù)元,以及每個數(shù)據(jù)庫之間的關系,并能夠逐層次的展示各層的信息以及關系。能夠使用檢索方式、分類方式來具體的定位到相關的信息。

  應用軟件的詳細描述與統(tǒng)一管理,包括應用軟件的描述、應用軟件使用數(shù)據(jù)庫資源的描述。應用軟件包括軟件開發(fā)的起始日期、目標、版本、開發(fā)語言、開發(fā)人員、源代碼、可運行包、狀態(tài)、安裝運行條件、軟件描述、使用者、幫助文檔、安裝文檔等信息。

  管理工具需要管理這些信息并能夠映射數(shù)據(jù)庫資源,能夠看到每個軟件所使用的數(shù)據(jù)資源,并能夠從數(shù)據(jù)庫資源導航到相關的軟件。

  服務器信息的管理主要指數(shù)據(jù)庫資源在具體服務器上的分布以及存貯信息,包括服務器的編號、所安裝的數(shù)據(jù)庫、數(shù)據(jù)量、可存貯量、實際的數(shù)據(jù)存貯情況、每個數(shù)據(jù)庫的超級管理員帳號、數(shù)據(jù)庫表空間的帳戶信息等。每個數(shù)據(jù)庫資源需要映射到相應的服務器。

  3.3 中醫(yī)藥數(shù)據(jù)資源結(jié)構(gòu)圖譜功能

  由于中醫(yī)藥數(shù)字資源的內(nèi)在聯(lián)系不是單向或線性的,而是呈網(wǎng)狀的復雜關系,因此,不可能通過單一的線索或統(tǒng)一的機制描述全局的狀況。建立中醫(yī)藥資源結(jié)構(gòu)圖譜目標是要通過多種模式,多角度和多層次地挖掘和揭示這些內(nèi)在關系,通過鏈接、集成和嵌入實現(xiàn)資源之間、資源和服務的整合。其實現(xiàn)的主要功能如下。

  3.3.1 數(shù)據(jù)庫資源管理功能

  該項功能主要實現(xiàn)對數(shù)據(jù)庫元數(shù)據(jù)的管理和展示,主要分數(shù)據(jù)庫管理、單個數(shù)據(jù)庫管理、單個表的管理以及數(shù)據(jù)庫信息展示4個子功能。

 ?、贁?shù)據(jù)庫管理。提供對數(shù)據(jù)庫信息的管理,包括以下功能:a.增加和刪除數(shù)據(jù)庫元數(shù)據(jù),并可以對其進行編輯(元數(shù)據(jù)包括制作人,起始日期,制作背景,目標,更新周期等);b.管理不同數(shù)據(jù)庫之間的關系,實現(xiàn)數(shù)據(jù)庫之間關系的增加、刪除、編輯功能;c.通過中醫(yī)藥分類詞表對數(shù)據(jù)庫進行描述。

 ?、跀?shù)據(jù)庫中表的管理。提供對指定數(shù)據(jù)庫中所屬表信息的管理,包括對數(shù)據(jù)庫中所屬表信息的管理。

  ③單個表對應信息的管理。提供對單個表對應元數(shù)據(jù)的管理,包括以下功能:a.對單個表的元數(shù)據(jù)進行管理,表中的字段信息可以直接從數(shù)據(jù)庫中得到;b.管理表對應的標準。

 ?、茉獢?shù)據(jù)的定位和展示功能。實現(xiàn)對元數(shù)據(jù)的定位和展示,包括可以對元數(shù)據(jù)進行逐層展示。根據(jù)數(shù)據(jù)資源分類標準進行元數(shù)據(jù)目錄分類的分層,并定位元數(shù)據(jù)。

  3.3.2 數(shù)據(jù)庫應用軟件管理功能

  這項功能主要實現(xiàn)對具體應用程序的描述和管理,包括以下子功能:①應用軟件自身信息的展示,包括軟件開發(fā)的起始日期、目標、版本、開發(fā)語言、開發(fā)人員、源代碼、可運行包、狀態(tài)、安裝運行條件、軟件描述、使用者、幫助文檔、安裝文檔等信息。②應用軟件使用數(shù)據(jù)資源的描述,可以查看軟件對應的數(shù)據(jù)資源。③增添元數(shù)據(jù)管展示功能,可以通過數(shù)據(jù)資源導航到相關軟件。

  3.3.3 應用程序信息管理功能

  實現(xiàn)對應用程序相關信息的管理,包括以下子功能:①增加、刪除和編輯應用程序的元數(shù)據(jù);②管理應用程序與其數(shù)據(jù)資源之間的關系,可以建立、刪除、編輯應用程序與數(shù)據(jù)資源(數(shù)據(jù)庫中的表)之間的關聯(lián)。

  3.3.4 服務器信息的管理

  實現(xiàn)對服務器上數(shù)據(jù)資源信息的管理,包括以下子功能:①建立、刪除、編輯服務器元數(shù)據(jù),包括服務器的編號、所安裝的數(shù)據(jù)庫、數(shù)據(jù)量、可存貯量、實際的數(shù)據(jù)存貯情況,每個數(shù)據(jù)庫的超級管理員帳號,數(shù)據(jù)庫表空間的帳戶信息等;②建立、刪除、編輯數(shù)據(jù)庫與服務器之間的關系。

  隨著網(wǎng)絡信息的海量增長,信息資源的有序化和信息的可用性問題已經(jīng)成為以數(shù)字化為核心的中醫(yī)信息資源建設中的一個關鍵問題。中醫(yī)藥科學數(shù)據(jù)中心與互聯(lián)網(wǎng)包容的信息內(nèi)容在數(shù)量和覆蓋內(nèi)容方面日趨全面,我們期待著設計更加科學、結(jié)構(gòu)更加完備、管理更加規(guī)范、功能更加強大的資源整合系統(tǒng),為網(wǎng)絡資源的發(fā)現(xiàn)、整合與利用提供一個全新而高效的技術平臺,為中醫(yī)藥信息服務開辟更加廣闊的發(fā)展前景。

315044