六月丁香五月婷婷,丁香五月婷婷网,欧美激情网站,日本护士xxxx,禁止18岁天天操夜夜操,18岁禁止1000免费,国产福利无码一区色费

學(xué)習(xí)啦 > 論文大全 > 畢業(yè)論文 > 管理學(xué)論文 > 檔案管理 >

淺析基于數(shù)據(jù)挖掘的數(shù)字檔案信息管理研究(2)

時(shí)間: 許惠瑋1 分享

  二、數(shù)據(jù)挖掘在建設(shè)現(xiàn)代化高校檔案館中的應(yīng)用
  1、資源類數(shù)據(jù)包括館藏檔案經(jīng)過數(shù)字化加工而產(chǎn)生的各類電子檔案、電子文件中心中存儲(chǔ)的各類電子檔案、檔案軟件收集的信息、檔案信息網(wǎng)建設(shè)和維護(hù)信息。我們從研究大學(xué)檔案用戶的信息需求出發(fā),數(shù)據(jù)挖掘?yàn)榇髮W(xué)檔案館全面掌握和準(zhǔn)確理解檔案用戶的信息需求提供了方法。
  (1) 利用Web訪問信息挖掘技術(shù)發(fā)現(xiàn)其中的關(guān)聯(lián)模式、序列模式和Web訪問趨勢等,構(gòu)建多維視圖的用戶興趣模型。從而可以確定檔案信息或服務(wù)受歡迎的程度,發(fā)現(xiàn)用戶訪問模式和用戶需求的趨勢,從不同側(cè)面來研究用戶的信息需求,為優(yōu)化檔案館的檔案信息資源建設(shè)提供了科學(xué)依據(jù)。
  (2) 收集大學(xué)檔案網(wǎng)web服務(wù)器保留的用戶注冊信息、訪問記錄,以及有關(guān)用戶與系統(tǒng)交互的信息等原始數(shù)據(jù),經(jīng)過清洗、濃縮和轉(zhuǎn)換形成便于統(tǒng)計(jì)分析的用戶查閱數(shù)據(jù)庫、日志數(shù)據(jù)庫、用戶定制信息庫、用戶反饋信息等各種數(shù)據(jù)集合。
  2、從建設(shè)大學(xué)檔案館館藏信息資源出發(fā),數(shù)據(jù)挖掘?yàn)榇髮W(xué)檔案館提供了選擇一條科學(xué)發(fā)展道路的重要依據(jù)。
  (1) 利用檔案網(wǎng)和檔案管理軟件訪問信息的挖掘分析出檔案資源的利用率,將利用率高、需求量大的傳統(tǒng)載體檔案優(yōu)先數(shù)字化。例如:通過對檔案信息的訪問記錄、檢索請求中用戶請求失敗的數(shù)據(jù)進(jìn)行分析,按類統(tǒng)計(jì)檔案拒用集和頻繁利用集,結(jié)合聚集算法發(fā)現(xiàn)館藏資源的缺漏,有針對性地補(bǔ)充和豐富檔案信息資源。
  (2) 在大學(xué)檔案館藏管理過程中利用文本挖掘,運(yùn)用關(guān)聯(lián)、分類、聚類等方法,從海量檔案信息中按照相關(guān)專題進(jìn)行挖掘、分類、加工、整理和有序化重組,構(gòu)建特色檔案信息庫及各類專題檔案信息庫等。
  3、從做好大學(xué)檔案館信息管理工作的角度出發(fā),數(shù)據(jù)挖掘?yàn)閮?yōu)化館藏信息和對未來工作的預(yù)測發(fā)揮重要作用。
  (1) 在提供利用環(huán)節(jié)中,對用戶每次借閱的信息進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)各類檔案信息之間的關(guān)聯(lián)規(guī)則或比例關(guān)系,這樣可以進(jìn)一步優(yōu)化館藏信息。
  (2) 開展大學(xué)檔案館館藏信息文本特征的建立、特征提取、特征匹配、特征集縮減和模型評價(jià)工作,實(shí)現(xiàn)對大量文檔集合的內(nèi)容進(jìn)行總結(jié)、分類、聚類、關(guān)聯(lián)分析、分布分析,通過歸納與總結(jié),發(fā)現(xiàn)的知識(shí)可以為未來檔案工作的趨勢進(jìn)行預(yù)測。
  三、數(shù)據(jù)挖掘在管理類數(shù)據(jù)中的應(yīng)用
  大學(xué)檔案館的管理類數(shù)據(jù)包括:智能監(jiān)控系統(tǒng)、消防系統(tǒng)、溫濕度控制系統(tǒng)、智能密集架、數(shù)據(jù)管理系統(tǒng)、數(shù)據(jù)利用系統(tǒng)等在日常工作產(chǎn)生大量的管理類數(shù)據(jù)。我們得用數(shù)據(jù)挖掘工具在這類看似無用的數(shù)據(jù)中提取有價(jià)值的知識(shí)并運(yùn)用到大學(xué)檔案館工作中,并在大學(xué)檔案館的現(xiàn)代化建設(shè)中發(fā)揮作用。
  大學(xué)檔案館檔案工作的重點(diǎn)是為師生服務(wù),以服務(wù)為中心開展各項(xiàng)工作,如何使用先進(jìn)的工具,提高服務(wù)的質(zhì)量是一直困擾我們的難題。數(shù)據(jù)挖掘?yàn)榇髮W(xué)檔案館檔案工作的智能化、個(gè)性化、精品化提供了行之有效的方法。在智能檢索系統(tǒng)可調(diào)用用戶興趣模型,自動(dòng)修正檢索策略并可依用戶興趣將檢索結(jié)果迅速聚類和分類,并條理化地排序出來;對于設(shè)計(jì)院、社科院等科研型檔案用戶,可借助數(shù)據(jù)挖掘開展針對性的檔案信息挖掘,并將研究成果以概述、成果報(bào)告等形式提供給用戶。這樣不光實(shí)現(xiàn)了大學(xué)檔案的二次開發(fā),也會(huì)給用戶帶來意外的驚喜。
  網(wǎng)絡(luò)最初只是科學(xué)家與研究人員之間交換文件的軟件,把因特網(wǎng)用于教育和研究可以得到政府的補(bǔ)貼。在中國,大學(xué)有撥款,圖書館有大學(xué)支持,數(shù)字圖書館的網(wǎng)絡(luò)檔案館是不贏利的,產(chǎn)出是教學(xué)和科研的長期社會(huì)效益。今天,因特網(wǎng)已經(jīng)越來越商業(yè)化了,網(wǎng)絡(luò)在數(shù)字經(jīng)濟(jì)中已成為極具潛力的技術(shù)投資對象。大學(xué)數(shù)字圖書館也可以考慮建立以贏利為目的的網(wǎng)絡(luò)檔案庫,采用網(wǎng)絡(luò)商務(wù)中的一些商務(wù)模式,例如網(wǎng)絡(luò)廣告、旗幟廣告、贊助廣告、訂閱、B2C等。收入可用于大學(xué)數(shù)字圖書館網(wǎng)絡(luò)檔案館建設(shè)的滾動(dòng)發(fā)展。目前人們對這些處于萌芽中的經(jīng)濟(jì)模式認(rèn)識(shí)甚少。管理網(wǎng)絡(luò)的公共政策制定主體是政府部門,推行電子政務(wù),開發(fā)網(wǎng)絡(luò)資源,促進(jìn)從文字印刷向網(wǎng)絡(luò)出版的轉(zhuǎn)移是當(dāng)前相關(guān)政府部門的重要任務(wù)。大學(xué)的政策、態(tài)度和措施對數(shù)字圖書館的發(fā)展至關(guān)重要。市場手段和政策平衡是網(wǎng)絡(luò)檔案館建設(shè),網(wǎng)絡(luò)檔案庫運(yùn)行,網(wǎng)上內(nèi)容傳遞和保存應(yīng)該和必須考慮的。
  參考文獻(xiàn):
  [1]Peer to peer Networking and Digital Right Management,by Michael A. Einhorn, Bill Rosenblatt, Policy Analysis No.534, CATO Institute. Fabruary 17,2005
  [2]What Every Citizen Should Know About DRM, aka Digital Right Management, by Mike Godwin Seuitoo Technology Counsel At Public Knowledge, 30 January, 2008, Ebook-Computer & Internet,
  [3]彼得·萊曼.把萬維網(wǎng)檔案化.信息化參考,2004(13)
  [4]周宏仁等.信息化助建和諧社會(huì)的14個(gè)著力點(diǎn).中國信息界,2008(3)
  [5]ITU-T Technology Watch Reports. 2006-2008, Telecommunication Standardization Policy Division, ITU Telecommunication Standardization Sector
44471