首页 >教育信息化 >本期目录>正文

以人为本,构建信息系统精细化运维服务体系

来源:本站 作者:周志强 唐玉龙 河南农业职业学院信息化建设领导小组办公室 发表于:2023.09.25  163浏览

/周志强 河南农业职业学院信息化建设领导小组办公室副主任

唐玉龙 河南农业职业学院信息化建设领导小组办公室运维部部长

摘要:运维服务体系是管理和维护IT基础设施的框架,确保系统高效、安全运行。其核心目标包括高可用性、性能优化、成本控制和安全管理;关键组成部分有监控、配置管理、故障排除、变更管理、安全和备份;最佳实践和标准如ITILInformation Technology Infrastructure Library,信息技术基础架构库)。其中自动化和数字化是不可或缺的。运维服务体系对组织的稳定性和成本效益至关重要,需要不断改进以适应技术和业务变化。

关键词:ITSM;ITIL4;CMDB;智能客服;全栈监控

 

随着学校信息化建设的持续推进和不断创新,信息系统不断壮大,师生用户对学校各类信息系统的依赖程度越来越高,信息化素养也在快速提升。用户不只关注系统能不能打开,难用、响应慢、故障报错等问题会对用户满意度产生更多负面影响。信息系统运维工作在信息化部门日常工作中占据的比重越来越大。

面对越来越复杂的业务和系统架构,面对越来越多样化的用户需求,只有通过畅通用户信息获取和问题反馈渠道、增强信息化部门运维能力、规范系统厂商服务,将用户、信息化部门、系统厂商三者联系在一起形成合力,才能助力学校信息化建设行稳致远。

我们认为信息化部门应始终坚持“以人为本,以服务为中心”的理念开展信息系统运维工作,建成统一运维平台,我校(河南农业职业学院)以此为指导,开展了“以人为本,构建信息系统精细化运维服务体系”的相关实践探索工作。

一、多手段摸清系统资产底数,构建系统资产管理闭环

建立配置管理数据库(Configuration Management Database,CMDB)是网络运维和IT服务管理中的关键步骤。由于历史原因,学校信息化部门并不掌握学校全部系统资产,所以必须摸清学校信息系统资产状况,才能有针对性地开展高质量系统运维服务工作。在实践过程中,主要通过以下三种方式互相结合来高效梳理学校信息系统资产:

1.自研采集程序对有域名系统进行全面梳理

学校信息化部门组织技术力量研发了采集程序,结合学校DNS中的域名数据,对学校所有子域名自动进行存活判定,并自动获取系统名称、系统语言框架、web服务器等指纹信息,快速形成系统资产清单A。

 

图1 采集结果

2.对校园网指定网段开展端口和服务探测,发现漏网之鱼

 

图2 网络端口服务探测

探测完成后形成资产清单B,将结果A和B比对合并形成初步资产清单C。

3.下发通知要求各部门、各厂商认领完善资

有了初步资产清单C,各部门工作量大大减轻,短时间内形成了较为完整的系统资产清单,如图3所示。

 

图3 完整系统资产

建立CMDB是一个渐进的过程,需要各部门的承诺和持续的努力。通过良好的配置管理实践,可以更好地理解和控制其IT基础设施,提高运维效率,并减少故障和风险。完整的资产清单形成之后,必须使资产的管理形成闭环,保持资产数据的完整性、准确性,才能使前期成果不落空、运维服务工作可持续发展。为达到这一目标,在实践过程中我们采取了以下措施:

一是规范信息系统新增变更流程,确保系统新增变更环节必须经过资产管理人员确认。后续将完善系统,将资产新增变更流程线上化。

二是利用自研采集程序持续对学校子域名、IP、校园网内端口服务进行监测,发现变动时及时通知资产管理人员进行处置。

二、引入智能客服,畅通信息获取和反馈渠道

由于信息化部门人员严重不足,践行“以人为本,以服务为中心”的理念往往是心有余而力不足。实践过程中,我们通过引入智能客服“农小助”来为用户提供7x24小时不间断的高质量服务。与传统的智能客服相比,“农小助”具有以下特点:

1.接入大语言模型,真智能客服

将大语言模型能力接入“农小助”后,农小助可基于文档、网页中内容精准、人性化地回答用户问题,还可控制是否开启大语言模型自身的能力。相比传统的收集整理问答库的客服方式,“农小助”极大提升了服务的灵活性和问题匹配回答质量。

 

图4 问答内容录入

2.提供一步到位的数据服务

基于前期数据治理成果,学校发挥数据价值,赋能“农小助”提供一步到位的数据服务。该功能上线当日,半天内使用人数超过1500人。通过提供数据服务,使用户更加喜欢“农小助”,同时配合宣传运营手段,使用户逐渐习惯使用“农小助”来找服务、获取信息、反馈问题。在后续实践过程,将进一步挖掘更多用户需求,提供更多数据服务。

 

图5 数据服务

3.提供工单与人工服务

对于“农小助”暂时无法回答的问题,用户可直接提交工单或请求人工客服介入

 

图6 人工客服与工单

在管理制度上,我们安排了专人做好客服和知识库更新工作,包括每日收集使用数据,汇总未命中问题并逐级反馈,不断完善问答内容。

三、全栈监控,精细化运维

为了摆脱被动应对的尴尬局面,全面增强信息化部门的运维能力,结合当前的信息技术趋势,我们在实践中采用了全栈监控技术对信息系统进行监测,可同时对页面前端、后端服务、中间件、数据库、服务器进行统一监控,既能发现系统异常报错,也能发现隐藏的性能问题。

 

图7 系统异常与性能监控

 

图8 系统调用链路

 

图9 前端用户身份识别与操作记录

通过上述手段和能力,当出现系统问题时,信息化部门可以根据掌握的信息和数据化被动为主动,第一时间定位问题根本原因,督促相关方进行处理,极大地减轻了沟通成本,杜绝厂商之间扯皮推诿。

四、遵循ITIL4的工单处理,规范厂商服务

信息系统的运维特别是问题处理离不开系统厂商,但因对厂商的售后服务质量一直缺乏数据支撑,无法形成有效监督,单凭主观判断,注定是千人千面。

在我校实践中结合自身实际,我们遵循ITSM(IT Service Management,IT服务管理)框架规范,实施了ITIL4(Information Technology Infrastructure Library,信息技术基础架构库)的工单系统,包括终端用户问题处理、系统监控异常处理、处理后知识库生成、SLA(Service Level Agreement,服务级别协议)考核,串联智能客服、资产管理、运维监控和知识库,设立关键绩效指标,持续监测服务水平和质量,并根据数据结果进行改进。将终端用户、信息化部门、厂商联系在一起,协调三方合力将问题快速解决,不仅提高了用户满意度,同时提高了各厂商的服务质量,确保学校的信息化投入产生良好效果。

 

图10 工单处理

工单处理完成后生成的知识库还可反哺智能客服,当用户再次遇到相同问题时,便可自动获得处理方法。以此实现将问题“左移”在源头消除。

五、结语

ITSM对这些系统进行了一个串联,用流程方式规范IT和运维。在ITIL4的规范和指导下,与CMDB、监控、工单高度结合,打造一站式运维平台,从学校实际出发,解决流程失误、人员失误,打造贴合的流程工单,提升IT生产力,提供IT新视野,提高IT运维效率。通过正确规划和实施,组织可以实现更强大、更稳定和更安全的IT基础设施,从而为未来的发展奠定坚实的基础

相关阅读