首页 >教育信息化 >本期目录>正文

南京大学:下一代图书馆系统平台的实践与思考

来源:南京大学 作者:邵波 张文竹 发表于:2019.06.28  675浏览

2017年,NMC Horizon Report: Library Edition指出学术研究图书馆未来5年内重要的技术发展趋势,大数据技术、图书馆服务平台、人工智能等技术发展将会影响图书馆的运作与服务,能大大促进学术型图书馆的变革与转型。大数据技术正深刻影响着图书馆的业务与服务。不少高校图书馆也与时俱进,充分运用人工智能技术不断向智慧图书馆转型。

南京大学智慧图书馆的研发产品——咨询服务机器人“图宝”和图书盘点机器人“图客”,是人工智能机器人技术在国内图书馆应用中的重大创新突破;清华大学基于人工智能算法将智能汽车的自动驾驶技术与图书馆的日常业务工作有效结合起来,提升了图书馆服务的智能化水平。另外,国内互联网公司如百度教育也正进军潜力巨大的智慧图书馆市场,利用人工智能、大数据与云计算三大技术全面建设智慧图书馆。

人工智能技术将引领图书馆从资源提供时代走向知识服务时代,以AI为核心、以解决不同场景的用户核心诉求为服务目标的智慧图书馆将是不可逆转的发展趋势。然而新一代图书馆系统平台有何具体定位、如何整合升级以便更好地服务图书馆工作,以及推广新系统平台的过程中的难点与解决办法、未来出路如何等,诸多围绕下一代图书馆系统平台的思考已然成为图书馆界讨论的焦点。

一、下一代图书馆系统的崛起

随着资源环境的改变以及读者诉求的增加,对纸本和电子资源进行无缝化管理,集成管理系统与电子资源管理系统功能融合一体建设的新一代图书馆系统成为时代所需。相较于传统系统而言,下一代系统重点功能(见图1)和特征有:

1)高度开放性与集成性。图书馆是各种类型资源及知识信息的集散地,也是公共文化服务与信息服务的中心,下一代图书馆系统将服务与资源进行充分整合集成,不仅能够管理馆藏资源,还能优化工作流程,并利于与读者通过系统交互,推动图书馆资源建设与服务。

2)新技术的广泛应用。技术的发展往往推动图书馆的进步,互联网的出现与发展推动图书馆系统建设更加注重以用户为中心,大数据与人工智能技术使图书馆能为读者提供更精准的服务,人馆更加和谐。

下一代图书馆系统采用SOASaaS和云计算技术、大数据及人工智能技术,利用这些现代技术为读者提供更全面更强大的知识服务。

目前国外市场上比较知名的相关系统产品有Alma(Ex Libris) WMS (OCLC) Sierra (Innovative interfaces)Intota(Serials solutions) Open Library Environment(Kuali)Open Skies(VTLS)BLUEcloud Suite( SirsiDynix)。除此外,目前还有一个为了改善互操作性和使用者服务、使用机器学习等新技术的开源图书馆服务平台——FOLIO(the future of libraries is open)也在不断的摸索中尝试重新定义图书馆服务平台。

市场上此类产品如今已推出并使用6年多,像Alma这种能提供统一解决方案,将纸本资源、电子资源、数字资产管理、元数据管理和资源发现等整合在同一个系统中,还可以优化工作流程和馆藏资源、支持多重标准,驱动用户参与资源建设,基于云提供远程服务等的下一代的图书馆系统平台正在成为图书馆的新选择。

如今在中国市场上应用较广的国外系统是Intota系统以及Alma系统,国内多家高校图书馆如清华大学、香港中文大学深圳、北京师范大学等已纷纷上线下一代图书馆系统。2017年,北京师范大学图书馆引进下一代图书馆系统Alma,并通过系统上线尝试重组业务、改进流程、提升效率、开拓新服务。

同时,随着智慧图书馆理念与实践不断成熟,不少高校图书馆、相关组织及数据商都在尝试自主研发下一代智慧图书馆系统,借助大数据分析等技术探索高度整合资源、读者与服务的智慧图书馆门户。

重庆大学以“平台化”建设为核心,以整合的文献搜索为基础,采用用户层、服务与管理层、资源层、评价与分析层数据服务层的架构实现管理和服务的全面信息化,重庆维普资讯公司也已联合重庆大学打造数字化校园的教学与科研应用图书馆服务门户,并将联合国内其他高校建设下一代图书馆系统;

深圳大学图书馆基于RICEKuali框架的OLE系统探索研发新系统,并在CALIS的推动下和EBSCO合作开发新一代图书馆系统;CALIS从技术架构出发,搭建微服务及微服务架构、FOLIO应用模式、互联模式和技术架构以及Codex模型,采用RAML标准、基于Raml/RMB生成接口定义从而构建新一代图书馆服务平台。

其他下一代系统平台如江苏图星的Libstar图书馆系统平台、武汉三新云平台、江苏仰格ERM平台等,充分结合大数据技术与人工智能等新技术应用,自主研发出构架更加完善、功能更加强大的下一代智慧图书馆系统平台。

虽然目前我国对下一代图书馆系统的研究多集中在国外产品功能和实践经验介绍、下一代系统的理论原理设计与开发等理论方面,实践经验研究较少,但以高校图书馆为主导的各类开发者都在积极地参与下一代智慧图书馆系统平台的研发与建设,迎合当前大数据与人工智能崛起的新技术环境下的用户需求,不断提升图书馆的核心服务能力。

二、下一代图书馆系统平台的难点及对策

1、标准化体系的制定有待完善

在下一代图书馆系统的信息建设中,存在着大量的交互操作与数据交换以及图书信息载体的元数据,如果没有相关科学的标准规范其统计的方式方法、整合标准、管理及清洗等,各个系统自成一家,变为数据孤岛,将会阻碍下一代图书馆系统的可持续发展。

2、用户缺乏自主选择权

由于下一代图书馆系统平台开发者较少,各个系统厂商间都存在壁垒,都是独立的、不通用的产品线,因此,厂商下一代系统都采用大包大揽的产品设计模式,使用户失去了对细分产品的自主选择权。另外,国内图书馆用户选择系统时,合适的产品售价同样是一个重要的参考因素,而有的产品售价脱离国内市场,使下一代图书馆系统的推广应用受阻。

3、迁移部署难度大

新系统平台的构建意味着旧系统的更新迭代,在更换系统后,后续一系列的管理以及部署上都有较大难度。

首先,完整的新系统虽然在国内尚未完全推广使用,但是一些模块,如ProQuestSummon发现服务、Primo资源发现与获取等都已经在使用中。这样系统的更换与对接便很难一步到位,整个过程实施周期长。其次,使用新系统后需要大规模的数据迁移,在此过程中可能会产生数据丢失的情况。另外在新系统的实施部署上,大量围绕图书馆系统的第三方数据接口,需要进行二次开发或采购,比如对接一卡通、数字化校园、自助借还设备的接口等。

4、业务流程水土不服

国外现有的系统产品的研发过程都是以商业利益为取向,并没有调查投放本地的图书馆环境,同时厂商本地支持匮乏,因此引入的新系统平台的许多流程并不适应国内市场实际需求,需要本地化厂商做二次补丁开发。

另外,对于使用者来说,下一代系统产品无论在技术架构还是产品功能上都有着较大差异,还需要重新适应新系统的操作界面和业务流程。有的系统应用微服务概念,采用实时在线的运营模式,这对于售后支持人员有了更高的要求。

5、云端部署带来的信息安全隐患

云服务是下一代图书馆系统平台最主要的资源与服务呈现形式,如何在云环境下安全部署数字资源及数字资产,是每个馆都应重视的问题。

信息安全隐患一方面来自数据网络传输中数据资产的完整与安全、数字资源知识产权的管理与保护,比如数据丢失或泄露、云服务商利用迁移的馆藏数据开发新产品造成版权冲突;另一方面来自图书馆作为服务主体对数据的控制权的问题,图书馆应该对馆藏数据、用户数据等拥有绝对监护权和控制权,但实际上这些数据都掌握在云服务商的手中,存在着被利用或非法泄露给第三方的风险。

虽然在建设下一代图书馆系统平台时有着众多的难点,但开放图书馆平台是大势所趋,积极寻找对策应对,才更能体现图书馆的服务能力与核心价值。

首先,构建一体化的元数据结构仓储标准规范、构建标准化的数据交换接口规范是基础。

其次是促进图书馆系统的本地化建设,CALIS(中国高等教育文献保障系统JALIS(江苏省高等教育文献保障系统)可以主动争取主导开发和市场运作中的话语权。同时本土图书馆系统开发商应该加强自主创新,甚至强强联合,加快下一代系统的研发进程,使产品更贴合国内市场需求,不再受制于国外厂商。

最后,对图书馆本身而言,对外应通过签订合同协议、加密馆藏数据等掌握数据的自主权,使数据不由厂商控制;对内优化迁移与部署流程,采用新技术保障数据信息安全,同时注重培养新系统平台高级运营人员,构建与多厂家、多机构协作,开放共享、互动良好的智慧图书馆服务体系。

三、智慧图书馆系统平台开发与实践

南京大学一直在努力探索和创新智慧图书馆的实践,在坚持超高频RFID智能图书盘点机器人“图客”与咨询服务机器人“图宝”的图书馆机器人开发的同时,对下一代智慧图书馆系统平台的尝试也从未止步。南京大学图书馆计划通过实施两种方案尝试构建智慧图书馆新平台。

1、构建一体化电子资源服务体系

资源建设是图书馆发展的根基。目前,实现纸电融合,构建一体化的电子资源服务体系,是当今图书馆资源建设的大趋势。

南京大学图书馆构建一体化电子资源服务体系,采用“纸质资源管理系统+电子资源管理系统+资源发现服务”多系统组合、按需定制的模式实现下一代图书馆系统大部分的功能需求。这种多层级服务、数据相互关联的统一管理体系,打破以往各系统孤立运行的模式。依靠一体化电子资源服务体系,用户可以通过资源导航查找所需数据库与出版物,访问学科主页,还可以通过Discover发现服务多元化方式获取全文。

图书馆可以通过电子资源管理系统进行数据库、订购单元、出版物三层结构的元数据管理,管理图书馆持有的数据库、数据包、出版物数据库对比分析;还可全面管理资源试用、资源评估、资源订购、资源激活、合同管理、资源续订等完整流程;通过定制院系学科主页、与发现服务深度整合以提高图书馆核心电子资源的学科保障率,进行学科资源建设;自动收割厂家Counter使用统计数据,从资源导航与远程访问系统中收集使用统计数据,自动统计分析数据库下属出版物文献被列入本校发文的参考文献数据等。

采用纸质资源管理系统+电子资源管理系统+发现服务的模式在现阶段实现绝大部分的下一代图书馆系统的主要功能,与国外现有下一代系统相比,更加一体化、灵活化和本土化(见表1),为推进未来共享、开放、共建的智慧图书馆体系建设打牢基础。

2、建设基于新一代系统的智慧图书馆服务平台(NLSP)

实现资源与服务的整合是下一代智慧图书馆系统平台的目标与任务。南京大学图书馆与江苏图星软件科技有限责任公司创新合作,致力打造新一代智慧图书馆服务系统平台( NLSP),目前已有了阶段性的实践成果。NLSP主要集成中央知识库、采选平台、馆员智慧服务平台以及读者应用服务平台四大模块,各平台具体功能表现如下:

1)中央知识库

知识库的建设与维护是影响系统平台成功实施与应用的一个重要因素,目前已有多个联盟、组织或数据商合作构建了开放知识库,比如Kuali OLE与英国联合信息系统委员会(Joint Information System CommitteeJISC)共同开发了“全球开放知识库”。南大图书馆设想构建电子资源百科的中央知识库,实现知识库共建共享。

该中央知识库涵括图书、期刊、论文、专利等多种资源,还包含资源包、供应商管理、许可协议、链接解析器功能,数据定时更新。同时平台接口开放,支持KBAT2OAI标准元数据交换,并支持SCISSCIEIISTPScopusPubmed等收录管理。

2)采选平台

图书馆采购纸质资源或电子资源往往通过联通馆配商上下游的书目信息共享平台,市场上较为知名的有人天书店的“畅想之星”、武汉三新的“云田智慧”和浙江新华书店的“芸台购”等。然而目前类似的产品功能参差不齐,有的平台是仅针对电子图书的购买,有的只是面向纸质书,有的以纸为主,尽量纸电同步。

同时,大多数平台没有涉及购买数据库类的电子资源的管理。这种分散的购买及管理造成采选流程复杂、效率低下,甚至会造成采选缺失或重复。针对上述问题,南大图书馆拟采用依托云计算、大数据分析平台,实现纸本资源、电子资源、数字资源的一体化智能采购管理。

整个采选过程中,多馆协作采购,主馆发布采购单,各成员馆直接选购。支持多种采购策略学科、分类等的智能选书功能,支持多种筛选条件,还可以根据馆员打分云比对采购书单。

浏览书目的过程中,依靠中央知识库数据支撑,自动获取元数据、封面图片、电子全文、目录和摘要。平台还支持物理资源一次性接收、连续性接收,以及包激活电子图书、电子期刊、电子资源并自动发布,使采购流程更加一体与流畅。

3)馆员智慧服务平台

智慧服务是以读者需求为目标的从管理到馆员各个方面体现的智慧化。馆员在进行信息服务与管理中涉及到的资源采访、资源管理、系统监控、资源典藏、读者服务以及分析决策,都将集成于新系统平台中进行统一操作。

比如一体化资源管理流程中,平台建立起包括CNMARCUSMARCRDADCRDF等多种元数据收割、整合、清洗和存储的标准、流程体系,整合电子资源管理(ERMI)、链接解析器管理(Link Resolver)、云端与本地存储的数字资产的管理及纸质资源管理(ILS),使馆员操作更加方便快捷,提高管理效率。

4)读者应用服务平台

打造基于读者需求驱动的图书馆智慧化服务是图书馆的宗旨。新图书馆系统平台除了为读者提供资源发现、全文阅读的基础服务,还通过读者荐购服务(PDA) 满足读者个性化需求,实现精准服务。另外,大数据处理技术与机器学习等人工智能技术也逐渐运用到智慧图书馆的服务上,反馈给读者更智能的服务形式。

比如利用大数据处理技术,采集来自数据库、日志等的数据源,导入并进行清洗和预处理,利用分布式数据库或计算集群分析汇总数据,基于用于聚类的K-Means、用于统计学习的SVM和用于分类的Naive Bayes等各种算法的计算,对其进行挖掘,深度研究用户行为,为读者提供定制化服务。

两种方案研发已历时一年有余,均采用社会化合作方式进行,现已完成新平台主体功能的开发,并完成了对原系统平台数据分析、书目数据整理和数据转入新系统的工作,达到预期目标,已进入系统测评及馆员培训阶段。(《图书情报工作》。本文系节选,有删减。)

相关阅读