1簡 介
1.1 資源發現系統
資源發現系統為圖書館提供了同時檢索元數據及全文信息的整合平臺,它與傳統的聯邦檢索的主要差別在于資源發現不用對外部資源進行實時檢索,而只需檢索預先存儲在自身巨大的中央索引中的元數據和全文信息,因此檢索速度較跨庫檢索快??墒钦f在某些程度上資源發現系統是聯邦檢索的進化,在一定程度上滿足了讀者使用類似于情報科學第33卷 第6期 2015年6月Google這樣的簡單而高效的搜索引擎的偏好。相較傳統OPAC,資源發現系統不僅能滿足傳統的目錄檢索,可實現從資源發現到資源獲取的真正“一站式”查詢,能提供查詢結果圖書封面和目次瀏覽,按相關度進行排序、分面精煉查詢、按照作品聚類不同版本和不同載體的同一著作、類似結果推薦、拓展查詢等可以有效提高查詢效率的多種功能;而且對注冊用戶,系統還提供個人借閱信息、最近檢索歷史、已保存的檢索式、個人文件夾等的查詢,同時可對查詢結果添加書評和標簽與他人分享閱讀體驗。目前國際市場上主流的統一資源發現系統有Summon、Primo、EBSCO Discovery Service(簡 稱EDS)、Worldcat Local和Encore五種,其中Summon、EDS和OCLC Worldcat Local是內容提供商推出的系統, Primo和Encore是系統提供商推出的產品。
1.2 學術搜索引擎
學術搜索引擎以學術資源為索引對象,一般涵蓋互聯網上的免費學術資源和深層網頁學術資源,將這類資源抓取、索引以統一的接口向用戶提供服務。學術搜索引擎按照覆蓋范圍可分為綜合性和專業性兩類,前者面向各種類型的學術資源,后者則專門針對某類學術資源;按照收費方式可分為免費和付費兩種.本文討論的是免費綜合性學術類搜索引擎,以Google Scholar、Scirus為代表。
2資源發現系統與學術搜索引擎的對比
相較資源發現系統,圖書館近年來普遍采用聯邦檢索系統存在著運行速度慢、檢索結果雜亂有限等問題,有些圖書館為了彌補聯邦檢索的不足,將Google Scholar等學術搜索引擎與圖書館的鏈接服務器整合在一起,方便用戶找到自己所需信息。但是這兩者都不能很好地實現全部檢索結果的相關性排序、查重和歸并,資源發現系統的出現較好地解決了這個問題。為了更好地了解資源發現系統的功能和特色,本文選取在國內關注度較高的Summon、EDS和Primo三個資源發現系統與綜合性學術搜索引擎Google Scholar、Scirus進行比較分析,比較將從元數據、系統架構、檢索功能三個方面展開,如表1、表2、表3所示。
考察資源發現系統與學術搜索引擎的元數據筆者發現,資源發現系統的元數據有三種來源:一是內容提供商簽約直接獲得授權的元數據,系統廠商除了獲得授權的元數據,還盡可能得到對全文進行索引的授權,以提高檢索質量。
Summon和EDS是由內容提供商推出的系統,其元數據中有大量內容提供商(如Proquest、EBSCO、HathiTrust)長期與Summon和OCLC合作,以提高其數字館藏的可發現性,這種來源的數據合理合法、直接、可靠、穩定、質量高、數量大。二是采用元數據收割的方式。對于開放資源和無法取得授權的元數據,系統廠商一般會采用基于OAI-PMH協議的元數據收割技術,收集網絡開放資源以及未授權的第三方元數據,這類元數據通常不如第一種方式獲得的元數據質量高。三是本地館藏資源的元數據上載,本地資源是資源發現系統要覆蓋到的重要內容,需在系統部署實施時對本地資源的數據進行映射和上載,并定期更新.
學術搜索引擎以兩類學術資源為索引對象:
一類是深層/隱形網頁,主要是一些資源供應商提供的付費資源,如存儲在數據庫中的資源,這類資源不能被普通搜索引擎檢索;另一類是互聯網上普通的學術資源,如學/協會的網站、大學或研究機構的網站、公司的網站、科學家的個人網站/主頁等,這些資源一般都可以免費獲得。但是不同學術搜索引擎索引的具體數據源仍存在差別。
Scirus詳細列舉了其資源的來源范圍, Google Scholar并未明確指出其資源來源。在索引資源的數量方面,Google Scholar與Scirus基本處在相同的量級上.
從部署模式上看,Summon和EDS采用了目前流行的云服務模式,而Primo將元數據倉部署在云端,將本館館藏和自建資源數據部署在本地;Google scholar和Scirus均采用遠程訪問的形式。三個資源發現系統均在與圖書館OPAC整合方面有所建樹,Primo除顯示館藏位置和在架狀況外,還可進行預約、續借、寫評論,加標簽等操作,并集成了個人圖書館的相關功能,Summon和EDS提供學科元數據集,有利于用戶定位所需學科.作為搜索引擎,Google scholar搜索結果也可包含圖書館相關資源的鏈接,用戶可以利用該鏈接訪問所屬圖書館資源,而且也提供中文檢索界面,同時整合了國內的維普和萬方資源系統??疾斓娜齻€資源發現系統都有引文顯示功能,尤其是Primo的學術推薦和熱點文章推薦服務,體現了資源發現的特色。另外資源發現系統都有很好的可擴展性,圖書館均可進行二次開發,當然Google scholar也提供了Library Link鏈接,方便圖書館揭示館藏資源。
總體來看,資源發現系統與學術搜索引擎的檢索功能不分伯仲,二者目標相同,相比之下,學術搜索引擎操作簡單、資源覆蓋面廣,更容易吸引用戶。特色功能方面資源發現系統明顯勝出一籌,Primo對圖書館OPAC整合方面優勢明顯,除了能夠顯示館藏位置和在架狀況外,還可進行預約、續借、寫評論、加標簽等操作,并集成了個人圖書館的相關功能,大有取代OPAC的勢頭。
Summon和EDS提供分學科的元數據集,這和圖書館的學科化服務的宗旨相一致。引文檢索功能是Google scholar的亮點,在線推薦檢索詞表是Scirus獨有的,系統會根據用戶的檢索式保留反映主題內容的關鍵詞??傊?,學術搜索引擎側重資源線索的揭示,資源發現系統擅長資源結果的準確定位。
3圖書館引進資源發現系統的策略
3.1 科學評估館藏和系統狀況
資源發現系統自2008年問世到現在已吸引了國內外大量的圖書館,然而作為一個新興事物,價格較高、中文資源覆蓋不足,自由數據收割困難等問題是目前資源發現系統在國內發展的瓶頸,國內圖書館普遍存在著經費不足、技術薄弱、數字化程度低等問題,因此圖書館引進時要考慮本館的資源狀況、系統的兼容性、性價比等問題,力求最大程度發揮資源發現系統的功能。
資源發現系統給用戶帶來了全新的檢索體驗,統一界面單一檢索框使用戶不必在各個數據庫系統之間跳轉,不必花費很大的精力去熟悉各個數據庫系統的使用方法。資源發現系統實現了圖書館紙本資源和電子資源的整合,用戶能夠同時檢索圖書館各種類型的資源,甚至包括一些沒有被圖書館訂購但被中心索引覆蓋的其他資源,如開放獲取資源,因此資源發現系統將大大提高圖書館的服務水平,但價格高昂,對元數據質量的要求也較高,而國內許多圖書館經費有限,而且現有的系統存在著諸如開放性不夠、與第三方系統交互困難等問題。雖然主流的資源發現系統一般采用單純的云計算和混合服務模式,對圖書館的技術力量要求不高,但圖書館租用和維護數據需要一定的技術水平,因此不能盲目跟風引進資源發現系統,中小型圖書館可通過在主頁鏈接學術搜索引擎解決用戶的部分資源需求,有條件的大型圖書館引進時一定要詳細評估本館的資源和系統狀況,詳細考量本館的技術支持情況,投入維護的人力和硬件設備的費用。
3.2 注重并完善元數據質量
從某種意義上說,資源發現系統是一個學術搜索引擎,是擁有海量學術信息的元數據倉儲。元數據質量不僅關系到發現內容的質量,還關系到針對海量元數據倉儲進行數據挖掘的效果。在資源發現系統中元數據有“厚、薄”之分,“薄”指包含題名、作者、合作者、來源、標識等基本信息的元數據,“厚”指除了基本信息外還包括主題、摘要等信息。
對圖書館而言,合理評估資源發現系統的元數據質量既重要又富有挑戰性。資源發現系統首先是一個海量的元數據倉儲,其收集的數據量巨大;獲取元數據的渠道繁雜,以Primo為例,其獲取元數據的數據源有6 000多個.因此圖書館引進時應將本館引進的資源按平臺、子庫、電子圖書、電子期刊等類別進行梳理,將本館的資源與主流資源發現系統的覆蓋范圍進行比對,將不同資源發現系統的元數據質量進行比對,明確系統中第三方數據多還是直接與內容商提供簽約的多,經過詳細的考察、調研和館藏資源的匹配對比后明確需求側重點,選擇本館需要資源發現系統,西安交通大學資源發現系統就選擇了Summon的SummonTM服務(一站式發現服務)、360Link鏈接服務(全文鏈接服務)、360Core(本館電子資源和其他資源的配置)、360Search (少數特殊特種文獻數據庫的統一檢索)四個模塊功能。系統引進后,還應不斷對系統中本館訂閱資源進行維護,做好新增資源、停訂資源鏈接地址的更新,另外為了不影響發現系統的分面顯示效果,圖書館傳統的編目人員應整理好現有CNMARC和USMARC以及學位論文數據,技術人員在系統配置好已訂購的數據庫,核對數據庫中書刊的品種和數量,填寫好各種數據與系統的映射表等。
3.3 加強資源發現系統與本館管理系統的整合
目前國內圖書館主要依賴系統供應商的OPAC提供服務,受制于軟件更新頻率和開發理念,圖書館難以按照自己的構想實現當前新型網絡環境下資源發現系統的功能。國產圖書館集成管理系統軟件目前還沒有一家推出真正意義上的資源發現系統,如何處理資源發現系統與ILS系統的關系是每個圖書館應認真考慮的問題。圖書館引進時必須考察檢索系統的易用性、檢索性能、檢索結果集的排序和顯示以及與OPAC系統的融合度。資源發現系統與ILS的整合分為兩個步驟。首先將本地的ILS數據上載到發現系統中,與龐大的元數據倉儲一起或者分別建立索引。然后在此基礎上整合OPAC功能,即將用戶續借、預約、個人記錄查詢等服務功能在發現系統中體現出來。要解決的核心問題是館藏書目數據增量的處理,館藏實時流通信息的獲取和讀者借閱狀態信息的獲取與聯動,所有這些工作都需要圖書館本部門的協作分步驟完成,系統管理員負責與廠商聯系提供需求,技術館員負責配置數據庫、咨詢人員和編目人員負責數據測試等。
3.4 改進資源發現系統的檢索功能
資源發現系統引進后,國外圖書館一般只在圖書館主頁上提供一個檢索框,讓讀者一次就能檢索所需的所有資源,這個比較符合國外用戶的習慣,但國內大多數用戶習慣了使用OPAC檢索圖書館的書目信息,而且很多用戶到圖書館來主要是檢索紙質的書目信息,因此圖書館要將資源發現系統和OPAC系統并列設置在顯著位置讓讀者選擇,如北大圖書館主頁上提供“未名學術搜索”、“館藏目錄”、“數據庫”以及“電子期刊”四個檢索框,這樣不至于給用戶造成困擾?,F有的資源發現系統都是國外開發的,英文檢索功能比較強大,對中文資源的覆蓋范圍不夠,檢索功能也不夠完善,本文考察的三個資源發現系統目前國內只有11家用戶,這和它們的用戶總量1550相比可以說是九牛一毛,11家用戶中只有清華大學和山東大學的Primo系統安裝了維普元數據,加之當前的資源發現系統只是一種綜合性的搜索,不能結合用戶興趣或用戶偏好,實現個性化的檢索和顯示。所以,圖書館引進了資源發現系統后,必須通過各種手段對信息資源進行多層次網絡型的組織,建立學科導航、數據庫導航等,指引用戶從各個角度、各個入口進入使用資源。另外為了盡可能發現用戶的所需資源,圖書館應聯合系統商根據用戶的需求對檢索結果的排序進行不斷優化和調整,與廠商合作進行相關度算法控制的配置,分別對詞頻、字段、主題、記錄被獲取次數、是否被同行評議、被引次數、文獻類型、近義詞的模糊歸類等影響因素設置權重,提高檢索結果的顯示度。
隨著資源發現服務系統的普及,國外圖書館對其有用性開展了大量的評估工作,以便幫助圖書館科學決策,改善用戶發現體驗,優化發現系統的性能和界面設計。因此國內圖書館引進資源發現系統后要定期對用戶滿意度和用戶需求進行評估,要不斷調整發現系統內容、改進功能與界面設計,從而滿足用戶不斷變化的期望和需求。
參考文獻:
1項 英,李向軍.高校圖書館資源發現服務系統應用研究[J].情報科學,2012,(11):1681-1684.
2常 唯.綜合性學術搜索引擎研究[J].大學圖書館學報,2007,(2):73-78.