網(wǎng)絡(luò)讀者訪問(wèn)流量統(tǒng)計(jì)分析系統(tǒng)的研究與實(shí)現(xiàn)
1 前言
隨著數(shù)字圖書(shū)館的建設(shè),圖書(shū)館館藏資源數(shù)字化的快速發(fā)展,圖書(shū)館以網(wǎng)站的形式向讀者提供信息資源的服務(wù)越來(lái)越多,這些服務(wù)有圖書(shū)館門(mén)戶、館藏資源檢索、光盤(pán)數(shù)據(jù)鏡像、電子書(shū)刊、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、自建數(shù)據(jù)庫(kù)和虛擬參考咨詢等等,為了揭示網(wǎng)絡(luò)環(huán)境下讀者對(duì)這些信息資源的瀏覽情況、閱讀情況以及訪問(wèn)變化趨勢(shì),準(zhǔn)確了解讀者需求分布和需求增長(zhǎng)等情況,從而對(duì)網(wǎng)絡(luò)讀者的信息資源尋求行為模式進(jìn)行研究,以便能為讀者提供更好的服務(wù),圖書(shū)館須了解以下幾個(gè)問(wèn)題:網(wǎng)絡(luò)讀者是如何訪問(wèn)網(wǎng)站的,這些信息資源是如何被訪問(wèn)使用的,如何評(píng)價(jià)這些信息資源的利用情況等等。為了回答這些問(wèn)題,我們通過(guò)本系統(tǒng)對(duì)圖書(shū)館多個(gè)信息資源發(fā)布網(wǎng)站進(jìn)行讀者訪問(wèn)流量統(tǒng)計(jì)、熱點(diǎn)網(wǎng)頁(yè)訪問(wèn)統(tǒng)計(jì)、讀者訪問(wèn)來(lái)源統(tǒng)計(jì)析及各項(xiàng)專題訪問(wèn)統(tǒng)計(jì)等研究,并根據(jù)統(tǒng)計(jì)結(jié)果反映的讀者需求分布和需求增長(zhǎng)等數(shù)據(jù)對(duì)信啟、資源網(wǎng)站的架構(gòu)、界面的設(shè)計(jì)、發(fā)布的內(nèi)容加以修改和調(diào)整,以滿足讀者需求為目標(biāo),吸引了讀者的目光,提高了圖書(shū)館信息資源建設(shè)和服務(wù)水平。
本系統(tǒng)通過(guò)對(duì)信息資源的訪問(wèn)記錄進(jìn)行統(tǒng)計(jì)分析來(lái)了解讀者的信息需求,這種量化的方法具有客觀和經(jīng)濟(jì)的優(yōu)點(diǎn),還可配合調(diào)查研究法得到更實(shí)際的結(jié)果,并以此探討網(wǎng)絡(luò)信息計(jì)量學(xué)在對(duì)信息資源使用成效進(jìn)行評(píng)估的應(yīng)用,包括所遭遇的困難及應(yīng)對(duì)之道,以期為信息資源的訪問(wèn)評(píng)估與改進(jìn)尋找可行的方法。
2 系統(tǒng)的實(shí)現(xiàn)
訪問(wèn)量的多少是衡量網(wǎng)站是否成功的重要標(biāo)準(zhǔn),但對(duì)于圖書(shū)館網(wǎng)站是遠(yuǎn)遠(yuǎn)不夠的,圖書(shū)館需要獲取完整的讀者訪問(wèn)流量統(tǒng)計(jì)數(shù)據(jù),來(lái)對(duì)圖書(shū)館信息資源的使用情況進(jìn)行分析,網(wǎng)絡(luò)信息計(jì)量學(xué)方法是目前網(wǎng)絡(luò)界普遍采用的網(wǎng)站績(jī)效評(píng)估計(jì)量法,被認(rèn)為是可以用科學(xué)的方法檢驗(yàn)網(wǎng)站訪問(wèn)數(shù)據(jù)的一種工具。它的目的包括了解網(wǎng)絡(luò)讀者的行為、確定網(wǎng)站是否吸引適當(dāng)?shù)淖x者來(lái)訪、評(píng)定網(wǎng)站建設(shè)策略是否得當(dāng)。其實(shí)施步驟可分為三個(gè)階段:
(1)記錄網(wǎng)站的訪問(wèn)數(shù)據(jù);
(2)分析記錄數(shù)據(jù);
(3)為網(wǎng)站建設(shè)策略的改進(jìn)提供依據(jù)。
2.1 系統(tǒng)原理
由于網(wǎng)絡(luò)發(fā)布站點(diǎn)和數(shù)據(jù)庫(kù)本身具備了訪問(wèn)計(jì)量功能,各自的信息資源收藏狀況便于人們掌握,并且能自動(dòng)記錄讀者訪問(wèn)的登錄情況,如登錄名、登錄時(shí)間、瀏覽文件、讀者的來(lái)源地址等,這些數(shù)據(jù)資料能夠準(zhǔn)確反映讀者訪問(wèn)信息和來(lái)源分布等情況,所以依據(jù)圖書(shū)館網(wǎng)絡(luò)讀者訪問(wèn)統(tǒng)計(jì)的工作內(nèi)容,制定相應(yīng)的分析指標(biāo),并收集網(wǎng)絡(luò)讀者訪問(wèn)圖書(shū)館信息資源發(fā)布站點(diǎn)形成的日志文件,然后利用日志統(tǒng)計(jì)工作軟件定時(shí)對(duì)日志文件進(jìn)行處理,得到統(tǒng)計(jì)數(shù)據(jù),并動(dòng)態(tài)生成各種表達(dá)形式的能滿足圖書(shū)館各項(xiàng)統(tǒng)計(jì)分析工作的報(bào)表。最后把生成的分析報(bào)表導(dǎo)入到發(fā)布數(shù)據(jù)庫(kù)中發(fā)布出去。
圖書(shū)館各個(gè)網(wǎng)絡(luò)資源站點(diǎn)建設(shè)人員可通過(guò)瀏覽網(wǎng)絡(luò)讀者訪問(wèn)流量統(tǒng)計(jì)分析報(bào)告,分析和了解讀者的訪問(wèn)需求,從而做好網(wǎng)絡(luò)信息資源的建設(shè)工作。
讀者行為分析研究則可通過(guò)對(duì)分析報(bào)告進(jìn)行質(zhì)化研究,并結(jié)合一般調(diào)查法、咨詢研究法對(duì)讀者的信息尋求行為進(jìn)行研究。
本系統(tǒng)還可利用統(tǒng)計(jì)分析的結(jié)果來(lái)對(duì)系統(tǒng)自身工作進(jìn)行評(píng)估和調(diào)整。
2.2 分析指標(biāo)
傳統(tǒng)圖書(shū)館的分析指標(biāo)和計(jì)量方法,雖然和數(shù)字化圖書(shū)館有很多不同,但使用的目的及計(jì)量的準(zhǔn)則并沒(méi)有太大實(shí)質(zhì)性差異[4]。
參考傳統(tǒng)圖書(shū)館的分析指標(biāo)以及國(guó)內(nèi)外類似的研究結(jié)果選定了下列10個(gè)分析指標(biāo):
(1)讀者到訪人數(shù)和潛在讀者人數(shù)的百分比;
(2)到訪讀者表現(xiàn)了閱讀的興趣的百分比(采取明顯的閱讀行動(dòng));
(3)可能的讀者轉(zhuǎn)為經(jīng)常的讀者的百分比(經(jīng)常閱讀、下載資料);
(4)讀者的持續(xù)度(重復(fù)到訪讀者);
(5)讀者的忠誠(chéng)度(網(wǎng)頁(yè)瀏覽次數(shù)、再度到訪的次數(shù)及時(shí)間長(zhǎng)度);
(6)讀者停止閱讀行為的百分比(閱讀行為半途中止);
(7)讀者耗損率(現(xiàn)有讀者中停止閱讀行為者的百分比);
(8)讀者動(dòng)搖率(耗損的讀者/到訪讀者的總數(shù));
(9)讀者最近到訪時(shí)間(據(jù)上次到訪的間隔時(shí)間);
(10)讀者到訪頻率(多久到訪一次)。
就此參數(shù),我們可以從一個(gè)客觀的角度來(lái)觀察和評(píng)估圖書(shū)館網(wǎng)絡(luò)讀者訪問(wèn)情況。
2.3 系統(tǒng)框圖
網(wǎng)絡(luò)讀者流量統(tǒng)計(jì)分析系統(tǒng)功能框圖
2.4 工作方法
本系統(tǒng)工作方法主要是采集網(wǎng)絡(luò)讀者訪問(wèn)過(guò)程日志進(jìn)行量化分析法,它的優(yōu)缺點(diǎn)見(jiàn)表1。
讀者訪問(wèn)過(guò)程日志分析法優(yōu)缺點(diǎn)
量化分析法重視量的分析,本系統(tǒng)通過(guò)對(duì)訪問(wèn)過(guò)程日志以量的方法加以統(tǒng)計(jì)分析,首先根據(jù)為了研究讀者需求分布和需求增長(zhǎng)情況這一目的將研究?jī)?nèi)容歸類成若干分析單元,接著將分析單元以數(shù)量的方式加以表達(dá),進(jìn)而以此為解釋讀者信息尋求行為的依據(jù)。
2.5 技術(shù)實(shí)現(xiàn)
(1)系統(tǒng)結(jié)構(gòu)
本系統(tǒng)是以瀏覽器/服務(wù)器/數(shù)據(jù)庫(kù)體系結(jié)構(gòu)作為基本架構(gòu),通過(guò)ASP方式實(shí)現(xiàn)交互式、動(dòng)態(tài)的讀者訪問(wèn)日志統(tǒng)計(jì)分析系統(tǒng)。系統(tǒng)結(jié)構(gòu)框架如圖2所示:
讀者訪問(wèn)日志統(tǒng)計(jì)分析系統(tǒng)結(jié)構(gòu)框圖
(2)系統(tǒng)組成模塊
本系統(tǒng)有六個(gè)模塊組成:訪問(wèn)日志入庫(kù)、訪問(wèn)流量分析、被訪頁(yè)面分析、來(lái)訪讀者分析和統(tǒng)計(jì)分析圖表。
(3)系統(tǒng)運(yùn)行環(huán)境與開(kāi)發(fā)平臺(tái)
本系統(tǒng)運(yùn)行環(huán)境和開(kāi)發(fā)平臺(tái)如表2。
讀者訪問(wèn)日志統(tǒng)計(jì)分析系統(tǒng)模塊
表2 系統(tǒng)運(yùn)行環(huán)境及開(kāi)發(fā)平臺(tái)一覽表
軟件類別 軟件名稱
數(shù)據(jù)庫(kù) SQL Server 2000+FastTrends Database
操作系統(tǒng) Windows 2000 SP4 Server+Aix 4.3.3
Web服務(wù)器軟件 IIS 5.0+Apache 3.0
瀏覽器軟件 IE5.5
網(wǎng)頁(yè)制作 Frontpage2000+JavaScriPt
ASP工具 Editplus Text Editor
編程語(yǔ)言 Visual Basic 6.0
圖表軟件 Excel2000
(4)程序流程與代碼實(shí)現(xiàn)
該系統(tǒng)由main.asp(主界面程序)、flux.asp(小時(shí)、日、星期流量分析)、target.asp(被訪頁(yè)面分析)、visitor.asp(來(lái)訪讀者分析)、chart.asp(統(tǒng)計(jì)分析圖表)五個(gè)組成。
我們以“被訪頁(yè)面分析”模塊的程序流程和代碼說(shuō)明系統(tǒng)組成模塊的實(shí)現(xiàn)過(guò)程,該模塊程序流程圖如圖4。
“被訪頁(yè)面分析”程序流程圖
相應(yīng)代碼:
<table
<td class=定義的表格形式及表頭>
Set conn=server.creatobjectl("adodb.connection")
conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"
Set re=server.creatobject("adodb.recorderset")
re.activeconnection=conn
dbname=Application("logtime")——數(shù)據(jù)表名稱
re.open“QL語(yǔ)句”
do while not re.eof
執(zhí)行Recordset操作,服務(wù)器進(jìn)行統(tǒng)計(jì)計(jì)算
response.write——寫(xiě)入統(tǒng)計(jì)表
re.movenext
loop
re.close
程序中一些代碼說(shuō)明:
①Recordset的Open方法:允許用戶向數(shù)據(jù)庫(kù)發(fā)出請(qǐng)求,通常是運(yùn)行sql命令。如:Sqlquery="select logtime from intemetlog where day(logtime)=day(getdate())and month(logtime)=month(getdate())and year(logtime)=year(getdate())"Dbrs.open sqlquery,dbconnection,3,3
②Recordset的RecordCount屬性:可以取得當(dāng)前在Recordset對(duì)象中的記錄條數(shù)。如:set dbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount
③Recordset的MoveNext方法:移動(dòng)指針到Recordset對(duì)象的下一條數(shù)據(jù)。如:Dbrs.movenext
④Response的Write方法:負(fù)責(zé)將字符串信息輸出的用戶端。如:Response.write“頁(yè)面總訪問(wèn)量:“& amount &”<br>
⑤Recordset的Close方法:可以用來(lái)關(guān)閉指定的Recordset對(duì)象。如:Dbrs.close
2.6 系統(tǒng)運(yùn)行過(guò)程
下面以西安交通大學(xué)圖書(shū)館網(wǎng)站為統(tǒng)計(jì)分析對(duì)象說(shuō)明該系統(tǒng)運(yùn)行過(guò)程。
首先我們用FTP工具抓取網(wǎng)址為http://www.lib.xjtu.edu.cn的服務(wù)器,時(shí)間段為2003/01/01到2003/12/31的訪問(wèn)日志導(dǎo)入到數(shù)據(jù)庫(kù)中,該服務(wù)器完成圖書(shū)館網(wǎng)站的部分功能:門(mén)戶信息、OPAC、館際互借、電子期刊、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、參考服務(wù)等。
對(duì)日志分析系統(tǒng)進(jìn)行運(yùn)行參數(shù)設(shè)置:讀者訪問(wèn)時(shí)間間隔設(shè)為20分鐘;從最新QQ顯IP版軟件中導(dǎo)出讀者IP地址分配資料,轉(zhuǎn)換格式后導(dǎo)入到日志分析系統(tǒng)的地址表中,以便對(duì)讀者分群;設(shè)置過(guò)濾規(guī)格文件濾掉一些無(wú)用的訪問(wèn)信息,如背景圖片、圖書(shū)館Logo,頁(yè)面美化圖片和服務(wù)器漏洞掃描日志等日志信息,然后對(duì)服務(wù)器訪問(wèn)日志進(jìn)行初步統(tǒng)計(jì)分析,保存統(tǒng)計(jì)分析結(jié)果準(zhǔn)備進(jìn)行進(jìn)一步統(tǒng)計(jì)分析。
最后利用精致多樣的統(tǒng)計(jì)分析方法對(duì)初步統(tǒng)計(jì)結(jié)果進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)分析出的數(shù)據(jù)有:一年內(nèi)資源點(diǎn)擊與訪問(wèn)計(jì)數(shù);一年內(nèi)網(wǎng)站中最常使用的資源與服務(wù);一年內(nèi)點(diǎn)擊次數(shù)最多的讀者;一年內(nèi)務(wù)分群讀者的點(diǎn)擊次數(shù)比例;一年內(nèi)點(diǎn)擊次數(shù)與閱讀次數(shù)的變化;一年內(nèi)上網(wǎng)的讀者與累積成長(zhǎng)趨勢(shì);一周各天的平均點(diǎn)擊次數(shù);一天內(nèi)各時(shí)段的平均點(diǎn)擊次數(shù);校內(nèi)各區(qū)讀者點(diǎn)擊次數(shù)比例;各項(xiàng)相關(guān)資源被使用的情形等等。這些數(shù)據(jù)可用Eexel軟件生成直觀的統(tǒng)計(jì)分析圖表,部分圖表詳見(jiàn)實(shí)際應(yīng)用一節(jié)中。本系統(tǒng)的研究主要采用訪問(wèn)過(guò)程日志分析法,以內(nèi)容分析法、問(wèn)卷調(diào)查法輔助研究。主要考慮:一是這種方法在電子商務(wù)和其它網(wǎng)絡(luò)應(yīng)用的量化分析,已經(jīng)有許多研究成果,可使我們的研究更為便利;二是可以經(jīng)濟(jì)的,較具體客觀的分析到網(wǎng)絡(luò)讀者信息需求特性;三是通過(guò)定量的計(jì)算,定質(zhì)的分析,形成一種綜合分析的方式,以求分析結(jié)果更為客觀和科學(xué)。
3 實(shí)際應(yīng)用
從2002年開(kāi)始,我們從圖書(shū)館門(mén)戶網(wǎng)站讀者訪問(wèn)計(jì)數(shù)開(kāi)始了網(wǎng)絡(luò)讀者訪問(wèn)統(tǒng)計(jì)工作,從最初的圖書(shū)館首頁(yè)訪問(wèn)計(jì)數(shù)到現(xiàn)在應(yīng)用網(wǎng)絡(luò)讀者訪問(wèn)流量統(tǒng)計(jì)分析系統(tǒng)到以信息資源發(fā)布站點(diǎn)、數(shù)據(jù)庫(kù)為單元的訪問(wèn)利用上,取得了不少研究成果,下面我們介紹以2003年西安交通大學(xué)圖書(shū)館網(wǎng)站讀者訪問(wèn)日志為統(tǒng)計(jì)對(duì)象,獲得的一些統(tǒng)計(jì)分析結(jié)果。
表3是2003年圖書(shū)館網(wǎng)站的資源瀏覽次數(shù),訪問(wèn)次數(shù)與訪問(wèn)讀者數(shù)的統(tǒng)計(jì)表,我們看到一年內(nèi)資源的瀏覽次數(shù)是10,222,296,訪問(wèn)次數(shù)是 1,617,166,訪問(wèn)讀者是310,628,對(duì)照2003年西安交大統(tǒng)計(jì)公報(bào)教職工5341人,在校學(xué)生32766人的數(shù)據(jù)表明圖書(shū)館網(wǎng)站有很高的訪問(wèn)量。另外網(wǎng)絡(luò)訪問(wèn)讀者310,628遠(yuǎn)遠(yuǎn)大于學(xué)生和教職工的總和,表明有相當(dāng)多的讀者使用本館的資源,這說(shuō)明本館的信息資源豐富,吸引了很多讀者。網(wǎng)站不足之處是自建的外文資源很少。從表3看,來(lái)自國(guó)內(nèi)訪問(wèn)占6.43%,來(lái)自國(guó)外訪問(wèn)占0.01%。綜合以上資料,西安交大圖書(shū)館網(wǎng)站為校內(nèi)外讀者提供了方便、豐富的資源服務(wù),吸引了大量的讀者,但在國(guó)外的知名度很低,現(xiàn)有資源不能吸引國(guó)外讀者,對(duì)此圖書(shū)館采取一些措施,來(lái)解決這個(gè)問(wèn)題。
①建設(shè)網(wǎng)站的英文版本;
②把本校和本地一些有特色的文化資源數(shù)字化后,做成中英文全文數(shù)據(jù)庫(kù)。如錢(qián)學(xué)森多媒體數(shù)據(jù)庫(kù)、江南制造局多媒體數(shù)據(jù)庫(kù);
③參與中外數(shù)據(jù)庫(kù)合作建設(shè)項(xiàng)目,如中美百萬(wàn)圖書(shū)項(xiàng)目。
表3 圖書(shū)館網(wǎng)絡(luò)讀者和資源瀏覽訪問(wèn)統(tǒng)計(jì)(01/01/2003-12/31/2003)
瀏覽網(wǎng)頁(yè)數(shù) 網(wǎng)頁(yè)訪問(wèn)數(shù)(資源) 10,222,296
平均每日的訪問(wèn)網(wǎng)頁(yè)數(shù) 28,006
訪問(wèn)者會(huì)話數(shù) 訪問(wèn)者會(huì)話數(shù) 1,617,166
平均每日訪問(wèn)者會(huì)話數(shù) 4,430
國(guó)際范圍內(nèi)的訪問(wèn)者百分比 0.01%
未知區(qū)域內(nèi)的訪問(wèn)者百分比 39.55%
來(lái)自China的訪問(wèn)者百分比 60.43%
訪問(wèn)者數(shù) 單一訪問(wèn)者數(shù) 310,628
接著我們看一年間網(wǎng)絡(luò)讀者常使用的網(wǎng)站資源與服務(wù),圖5顯示的是讀者最常使用的前十項(xiàng)網(wǎng)站資源與服務(wù)以及它們占全部瀏覽次數(shù)的百分比。從圖中我們觀察到前十項(xiàng)占了訪問(wèn)量的43%,第一項(xiàng)是圖書(shū)館首頁(yè),然后依次是網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、聯(lián)機(jī)公共目錄查詢、中國(guó)期刊網(wǎng)……,這說(shuō)明圖書(shū)館網(wǎng)站的資源內(nèi)容設(shè)計(jì)與規(guī)劃合理,讀者訪問(wèn)資源方便,相關(guān)信息更新及時(shí),受到了讀者的歡迎。另外,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和聯(lián)機(jī)公共目錄訪問(wèn)比例接近說(shuō)明讀者并重利用印刷型資源和數(shù)宇化資源,數(shù)字化資源對(duì)科研和教學(xué)的作用日益明顯。從圖5中我們還觀察到所有的電子數(shù)據(jù)庫(kù)訪問(wèn)所占比例值呈現(xiàn)出指數(shù)下降的趨勢(shì),這說(shuō)明較少數(shù)數(shù)據(jù)庫(kù)的訪問(wèn)量較大,而較多數(shù)數(shù)據(jù)庫(kù)訪問(wèn)量較少,根據(jù)這個(gè)特點(diǎn),圖書(shū)館在采購(gòu)數(shù)據(jù)庫(kù)時(shí)可采取不同的采購(gòu)策略,對(duì)于使用量大的數(shù)據(jù)庫(kù)保證數(shù)據(jù)的更新量和連續(xù)性,則可滿足約80%的讀者信息需求,對(duì)于較多的使用量少的數(shù)據(jù)庫(kù)可采用合伙采購(gòu)共同使用的辦法,來(lái)滿足約20%的讀者信息需求。
圖書(shū)館網(wǎng)站前十名資源與服務(wù)以及它們占全部訪問(wèn)次數(shù)的比例(01/01/2003-12/31/2003)
接下來(lái)我們來(lái)分析常訪問(wèn)的讀者及其來(lái)源,首先,圖6中表示網(wǎng)絡(luò)讀者訪問(wèn)次數(shù)的分布,從圖6中可以看出75.15%的讀者只訪問(wèn)過(guò)一次,9.86%的讀者訪問(wèn)過(guò)兩次,6.49%的讀者則經(jīng)常訪問(wèn)圖書(shū)館網(wǎng)站,這說(shuō)明作為一個(gè)為大學(xué)教育和科研服務(wù)的信息中心,圖書(shū)館的網(wǎng)絡(luò)資源已經(jīng)有了固定的讀者,但還有大量讀者的信息需求不能滿足,為此圖書(shū)館通過(guò)參加一些文獻(xiàn)信息資源建設(shè)項(xiàng)目和組織,如中國(guó)高等教育文獻(xiàn)保障體系(CALIS),陜西省科技情報(bào)協(xié)作網(wǎng)等,以便獲取更多優(yōu)質(zhì)的文獻(xiàn)信息資源,增強(qiáng)圖書(shū)館文獻(xiàn)信息資源的保障能力。另外,圖書(shū)館信息資源大多數(shù)有訪問(wèn)權(quán)的限制,校外的讀者無(wú)法接觸到,為此圖書(shū)館采取了一些辦法,如建立電子數(shù)據(jù)庫(kù)導(dǎo)航庫(kù),電子期刊導(dǎo)航庫(kù),提供文獻(xiàn)傳遞等服務(wù)來(lái)滿足校外讀者的信息需求。表4是常來(lái)圖書(shū)館網(wǎng)站的讀者統(tǒng)計(jì)數(shù)據(jù),可以觀察到前二十名讀者絕大部分是西安交大校園網(wǎng)的讀者占全部來(lái)訪數(shù)的4.61%。如果以其上網(wǎng)所屬機(jī)構(gòu)來(lái)劃分來(lái)訪的網(wǎng)絡(luò)讀者,圖7是前十名各類機(jī)構(gòu)網(wǎng)絡(luò)讀者的訪問(wèn)。從圖7中,我們可以清楚的看到本校的用戶占73%,其中來(lái)自科學(xué)館的訪問(wèn)占3.23%,圖書(shū)館的讀者占3.18%,西一樓的2.34%,可見(jiàn)西安交大的校園網(wǎng)比較普及,讀者能夠很方便的進(jìn)入圖書(shū)館資源網(wǎng)站,這也表示圖書(shū)館提供給讀者閱讀電子資源的電子閱覽室滿足了讀者需要。在圖7中數(shù)據(jù)顯示,外校的讀者也經(jīng)常訪問(wèn)圖書(shū)館網(wǎng)站,如西安理工大學(xué)的讀者占0.33%,長(zhǎng)安大學(xué)的占0.31%,北京大學(xué)的占0.05%,西北工業(yè)大學(xué)的占0.17%,上海交大占0.08%等等,這些讀者主要使用聯(lián)機(jī)公共目錄查詢和使用自建數(shù)據(jù)庫(kù),這說(shuō)明高校間的信息共享正在發(fā)展,圖書(shū)館應(yīng)該加強(qiáng)自建特色數(shù)據(jù)庫(kù)的建設(shè),增強(qiáng)文獻(xiàn)傳遞和館際互借服務(wù),滿足這些讀者的信息需求。
表4 訪問(wèn)圖書(shū)館網(wǎng)站次數(shù)最多的前20名讀者及他們占的比例(01/01/2003-12/31/2003)
網(wǎng)絡(luò)讀者訪問(wèn)統(tǒng)計(jì)
訪問(wèn)者 點(diǎn)擊數(shù) 點(diǎn)擊率 訪問(wèn)者會(huì)話數(shù)
1 202.117.14.71 293,444 0.54% 2,893
2 202.117.14.15 112,249 0.2% 2,846
3 202.117.29.37 347,223 0.64% 2,554
4 202.117.0.9 80.700 0.15% 2,487
5 202.117.29.59 121,184 0.22% 2,427
6 202.117.39.47 114,629 0.21% 2,290
7 202.117.48.45 174,130 0.32% 2,120
8 202.117.14.24 147,500 0.27% 1,997
9 202.117.35.11 56,312 0.1% 1,985
10 202.117.48.51 96,210 0.17% 1,839
11 202.117.35.79 223,565 0.41% 1,792
12 202.117.48.101 107,631 0.2% 1,785
13 202.117.48.103 110,180 0.2% 1,775
14 202.117.24.84 14,652 0.02% 1,764
15 202.117.48.44 92,776 0.17% 1,726
16 202.117.29.58 121,756 0.22% 1,678
17 64.241.242.18 2,131 0% 1,673
18 202.117.48.77 51,682 0.09% 1,654
19 202.117.29.136 103,924 0.19% 1,623
20 202.117.27.13 109,429 0.2% 1,605
以上訪問(wèn)者合計(jì) 2,481,207 4.61% 40,513
總數(shù) 53,733,901 100% 1,617,166
接下來(lái)我們來(lái)觀察各類讀者在每個(gè)月訪問(wèn)網(wǎng)絡(luò)資源的比例變化圖,見(jiàn)圖8是各類網(wǎng)絡(luò)讀者訪問(wèn)前十名網(wǎng)絡(luò)資源的變化圖,總體訪問(wèn)變化的趨勢(shì)和學(xué)校的校歷安排有明顯的關(guān)系,每個(gè)數(shù)據(jù)庫(kù)的訪問(wèn)量變化則和各類讀者的信息需求不同有關(guān)系。這反映了讀者的結(jié)構(gòu)影響著網(wǎng)站的使用情形。
網(wǎng)絡(luò)讀者訪問(wèn)圖書(shū)館網(wǎng)站次數(shù)分布(01/01/2003-12/31/2003)
前十名各類主機(jī)訪問(wèn)圖書(shū)館網(wǎng)站的訪問(wèn)次數(shù)(01/01/2003-12/31/2003)
各類網(wǎng)絡(luò)讀者對(duì)前十名網(wǎng)絡(luò)資源訪問(wèn)變化圖(01/01/2003-12/31/2003)
由于篇幅有限,我們簡(jiǎn)單介紹了本系統(tǒng)對(duì)圖書(shū)館網(wǎng)站網(wǎng)絡(luò)讀者訪問(wèn)流量的統(tǒng)計(jì)分析結(jié)果,在以上的討論中,可以觀察到讀者利用網(wǎng)絡(luò)信息資源是聯(lián)機(jī)公共目錄檢索和信息檢索并重,且大部分讀者是本校的。
通過(guò)上述討論,我們知道本系統(tǒng)還有許多值得進(jìn)一步研究之處,下一步的研究方向是收集更完整的讀者訪問(wèn)日志,包括更長(zhǎng)期的和所有與圖書(shū)館資源訪問(wèn)相關(guān)的。并且嘗試?yán)镁碌慕y(tǒng)計(jì)方法來(lái)分析,以達(dá)到對(duì)網(wǎng)絡(luò)讀者行為更精確的解讀。
4 結(jié)語(yǔ)
經(jīng)實(shí)際應(yīng)用證明,該系統(tǒng)對(duì)我館信息資源建設(shè)起到了重要的促進(jìn)作用。首先,在控制我館信息資源存放空間問(wèn)題上,雖然目前看來(lái)效果不明顯,但如果越來(lái)越多的信息資源雜亂無(wú)章地占據(jù)信息空間,將會(huì)大大降低信息檢索的效率,干擾核心信息源的利用。本系統(tǒng)可以提供調(diào)整信息存放的定量依據(jù),在探明各類型信息資料數(shù)量特征的基礎(chǔ)上,分析其增長(zhǎng)和老化規(guī)律,判斷信息的價(jià)值和時(shí)效性,使有價(jià)值的信息充分地發(fā)揮作用,使信息空間得到有效的利用。
其次,在“以人為本”的理念指導(dǎo)下,圖書(shū)館走出了單純提供館藏信息資源為中心的定位,著眼于滿足讀者廣泛的信息需求。在本系統(tǒng)的指導(dǎo)下能實(shí)現(xiàn)這個(gè)目標(biāo):一是根據(jù)信息資源規(guī)律反映出的學(xué)術(shù)動(dòng)態(tài)和信息利用規(guī)律反映出的需求動(dòng)態(tài),指導(dǎo)圖書(shū)館的館藏資源建設(shè)。二是通過(guò)對(duì)信息資源利用規(guī)律的研究,使計(jì)算機(jī)信息檢索系統(tǒng)走向科學(xué)化、規(guī)范化,從而方便用戶查詢。
在整個(gè)研究過(guò)程中,取得了一些研究成果,也發(fā)現(xiàn)有不少問(wèn)題等待我們進(jìn)一步的研究,首先是無(wú)法取得確實(shí)充分的數(shù)據(jù),主要問(wèn)題是圖書(shū)館提供的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)是聯(lián)接到廠商的數(shù)據(jù)庫(kù)中去檢索的。如果圖書(shū)館自己沒(méi)有服務(wù)主機(jī),那么就要請(qǐng)廠商提供訪問(wèn)數(shù)據(jù),雖然廠商都會(huì)提供月報(bào)表,但是能夠判讀的資料不多,或是他提供的數(shù)據(jù)不標(biāo)準(zhǔn),或是他提供資料不是圖書(shū)館想要的。其次不易解釋數(shù)據(jù),有了訪問(wèn)過(guò)程記錄數(shù)據(jù),可是怎么去解釋它?讀者從哪里來(lái),做什么,這個(gè)比較容易解釋,可是要知道讀者做某件事的動(dòng)機(jī),就沒(méi)有辦法從數(shù)據(jù)中去解釋了。
【參考文獻(xiàn)】
1 Wonsik Shim,Charles R.McClure,John Carlo Bertot & James T.Sweet.ARL E—Metrics Project:Developing Statistics and Performance Measures to DescribeElectronic Information Services and Resources for ARL Libraries:Phase One ReportTallahassee,FL:Information Use Management and Policy Institutc,School oflnformation Studies,2000.http://www.arl.org/stats/newmeas/emetrics/phaseone.pdf(Accessed Sep.10.2001)
2 詹麗萍.E-metrics在數(shù)字圖書(shū)館使用評(píng)估的應(yīng)用.數(shù)字圖書(shū)館與數(shù)字博物館趨勢(shì)研討會(huì),2001:21-30
3 鄒菲.試論網(wǎng)絡(luò)信息計(jì)量學(xué)在數(shù)字圖書(shū)館中的應(yīng)用.圖書(shū)情報(bào)知識(shí),2001(1):16-20
4 邱均平.信息計(jì)量學(xué)(一).情報(bào)理論與實(shí)踐,2000(1):75-80
5 徐潤(rùn)萍,谷寧昌.利用ASP建立基于Web的MIS系統(tǒng)技術(shù)實(shí)現(xiàn)方法.計(jì)算機(jī)工程,2002(28):254-256