首页 >教育信息化 >本期目录>正文

高校网络运维管理的实践与探索

来源:河南城建学院信息中心 作者:闫涛 发表于:2015.09.03  1464浏览

随着信息化不断发展,各行各业对信息系统的依赖程度越来越高,高等学校作为新技术的引领者和践行者,校园网络建设和信息化发展也日新月异。自从党的十八大将信息化提升为国家战略后,很多高校已经将校园信息化定义为学校不可或缺的基础设施,数字校园、智慧校园成为高校公共服务体系重要的组成部分,这种地位的变迁对高校的网络运维提出了更高的要求。

笔者2000年起即从事校园网的运行维护和学校的信息化工作,对校园网的网络运维管理积累了一些看法,现将对网络运维工作的一些浅见成文,供大家商榷。

一、高校校园网的特点

高校校园网与企业网和运营商的网络相比,有着自己独特的结构复杂性、应用广泛性以及用户多样性特征。具体来讲体现在以下几个方面:

一是接入人数多,并发访问量大,上网高峰期比较明显。目前高等学校基本都实现了网络的全校覆盖,行政办公区、教学区、图书馆、宿舍区等均可以无缝接入校园网,访问校园内外的各种网络资源,加上在校学生数量逐年增加,并且拥有笔记本和台式机的学生越来越多,几方面的原因重合,导致校园网的接入用户较多。而且学生的作息和生活规律基本类似,一定程度上推高了并发访问的数量,具体表现就是上网高峰期比较明显,网络带宽严重不足。

二是学生上网体验要求高,客观上要求设备性能高,功能强大。学生是最活跃的群体,对网络的需求也是各种各样,但归根结底一句话——对上网的体验要求比较高,不仅要求网络7×24小时不能中断,并且还要求网络达到一定的带宽,以满足特定的应用需求,如下载、在线视频、联机游戏等。这在一定程度上要求校园网的核心设备和出口设备必须性能足够高,不仅能够满足学校出口带宽满负荷运行的需求,而且能应付突发的网络风暴,还能持续稳定运行,减轻网络故障率和日常维护工作量。

三是网络出口带宽高、连接运营商多,链路负载均衡实现较困难。一般高校均有联通、移动、电信和教育网等几家互联网线路,传统的做法是采用链路负载均衡器,实现上网访问的智能选路。

四是高校应用系统多,涉及学校教学、管理方方面面。网管人员既要熟悉业务流程,又要熟悉软件架构和业务的具体实现。面对高校如此大规模的网络架构和日益繁重的运维任务,运维管理人员相对不足,面临一职多能的局面,这特别要求技术人员责任心强,技术综合能力高。

二、高校网络运维的现状

高校校园网既是ISP (Internet Service Provider),向广大用户提供综合互联网接入业务、信息业务和增值业务;又是ICP,向校内和校外提供专属互联网服务。与运营级的服务网络相比,校园网具有的硬件基础设施如路由器、交换机、服务器、大容量存储、虚拟化系统、安全设备、负载均衡、CDN等,产品性能和功能毫不逊色;基础网络服务支撑系统如智能DNS、MAIL、认证计费系统、日志审计等全部具有,麻雀虽小,五脏俱全。

高校网络虽然服务的是师生,但服务标准却一点不低。网络充当了学校教学和管理的基础,保障网络稳定运行责任重大。但高校目前普遍欠缺的是运维团队,不仅欠缺运维人员的专业程度,而且欠缺专业运维人员的数量。虽然校园网在学校信息化工作中起着重大支撑作用,但是一般的高校网络运维部门人数都屈指可数。同时由于校内绝大多数用户没有分析基本故障的能力,导致遇到故障报修时只会说上不去网,连基本的PING命令和IPCONFIG命令都不会使用,只能由运维人员赶赴现场处理。运维人员在维修现场经常性发现造成网络故障的原因是用户操作系统或者工具软件问题,于是网络维护可能就变成了计算机系统维护。在高校这种用户规模情况下,类似事情发生的概率还是比较高的,直接导致了运维人员大量的时间浪费,网络运维机构变成了计算机应急故障排除中心或者充当“救火队员”的角色。虽然高校都制定了诸如人员值班、定期巡检、远程登陆检查设备或者采用一些工具辅助日常管理的制度,但由于人员不足和人员经常性“不务正业”的原因,相关制度的执行状况堪忧。

一般高校的网络运维都经历了纯人工、免费工具和使用专用系统三个阶段。在纯人工管理阶段,全校关于网络基础数据、网络配置数据、服务器配置数据以及应用系统的相关数据,基本都在负责人及各级管理员的本上或者电子表格里,用起来手忙脚乱,属于粗犷式管理,效率低下。免费工具阶段基本上使用开源的MRTG或Cacti,对网络设备和服务器的运行状态进行实时监控、预警和故障定位,能够在一定程度上减轻部分运维压力,但免费工具监控的内容还是受制于二次开发的程度。专用的网络运维管理系统价格昂贵,鉴于资金预算压力,多数学校并没有部署。

总体来讲,高校的网络运维工作欠账很大。网络拓扑架构、互联带宽、接入和汇聚设备、链路冗余、数据处理能力、数据备份和容灾等方面还有很大的改进空间,均存在不同程度的“凑合”阶段,不出问题则已,一出问题就是致命问题,很难在短时间内恢复网络的良好运行状态,影响网络的正常使用。

三、高校网络运维难题的破解

高校的信息化经历了校园网建设、数字校园建设、智慧校园建设等多个发展阶段。在这些不同的阶段,网络运维的工作定位各有描述,但其终极目标并未发生过改变,可以用“保持畅通、保证安全”八个字来概括,所有的工作目标围绕“畅通”和“安全”开展。这里所说的“畅通”主要是指从各个用户到网络中心畅通和各个用户到互联网畅通两个层次,实际上就是内网畅通,外网可达。“安全”主要是指学校网络设施(网络设备和服务器)、软件及其数据,不因偶然的或者恶意的原因而遭受到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。在高校校园网中,学校中心机房或数据中心起着内外相接的重要作用,所以建立一支可靠的运维队伍,做好学校中心机房或数据中心的维护是整个校园网运维工作的重中之重。

ITSS(信息技术服务标准)定义的IT服务的组成要素由人员(People)、流程(Process)、技术(Technology)和资源(Resource)组成,简称PPTR。其中,人员指提供IT服务所需的人员及其知识、经验和技能要求;过程指提供IT服务时,合理利用必要的资源,将输入转化为输出的一组相互关联和结构化的活动;技术指交付满足质量要求的IT服务应使用的技术或应具备的技术能力;资源指提供IT服务所依存和产生的有形及无形资产。

根据ITSS标准以及本人长期从事网络运维管理的实践经验,破解高校运维困境的方式应该从以下几个方面着手:

合理的人员及培训:对高校这种人员编制管理相对严格的单位,新进大量运行维护人员很不现实,这就需要充分发挥现职运维人员和学生管理员的主管能动性以及处理故障的能力,并根据高校的实际情况及运维管理的需求对现职人员进行分组,各司其职,立足岗位工作,服务教学、科研一线。

完备的制度及规范:根据学校情况,各运行维护方面应设置成不同的部门,并明确部门及岗位职责,划分工作界面;在全局的高度建立如机房日常值班制度、节假日值班制度、网络应急处理制度和流程、应用发布制度、设备割接制度等日常运维制度,以及系统重大变更的制度,形成以制度固定流程、以流程处理问题、严格按照流程和制度办事的局面。

必要的工具及平台:人员再多,能力再强,基于电子设备的特殊性,也无法在设备发生故障的第一时间知晓,因此配置必要的管理工具和平台还是非常有必要的:一是可以节省人力成本,使现职人员将精力更多的投入到与学校发展息息相关的网络、应用系统建设中来;二是可以在故障发生的第一时间通知到具体的管理员,缩短故障定位时间,提升响应速度,尽早解决问题;三是在某些情景下对误操作进行追溯和恢复。

严格的权限及管理:针对高校设备多、结构复杂且管理人员多的特点,应该建立严格的系统权限体系,将超级管理员、一般管理员、审计员和账户管理员等进行拆离,相关岗位只需掌握对应的用户名和密码即可,此种做法可在一定程度上减少设备误配置的可能性。另外,对于一些重要的设备和应用系统,应该采取一些特殊的管理方法,比如对超级管理员密码进行分段管理,禁止root直接登录,禁止应用运行于root之下,禁止非经允许的设备接入,禁止非经许可的用户登入等,以确保核心业务系统和设备的配置稳定。

及时的系统备份与恢复:针对现网运行的网络设备和安全设备配置,要进行定期配置备份,并在每一次更改配置后进行备份,以便在设备出现故障要使用备机时能够快速导入或者快速配置,恢复网络正常运行。针对关键应用系统和核心数据,要建立备份策略、容灾策略、恢复策略等机制并加以演练,对核心数据确立热备、本地备份等机制并加以演练。

四、我校的几点做法

万种应用,网络先行。没有网络畅通就没有一切网络应用,网络畅通是数字化校园乃至智慧校园的基础,同时也是智慧校园的重要组成部分。首先保证网络畅通是所有运维人员日常工作的最根本出发点,同时也是管理部门制定信息化发展规划的立足点。

“三分靠建设、七分靠管理”。为切实做好网络信息系统运行维护工作,在学校信息化工作实际要求的基础上,我校从制度和流程、手段和工具、人员队伍建设等方面入手,逐步构建先进、安全、高效、稳定的网络信息化运维体系,主要体现在以下几个方面:

1、日常管理方面,通过信息中心层面制定部门规划、管理制度、工作流程和岗位职责,确保日常运维工作的正常开展。信息中心下设网络运行部和信息管理部。网络运行部负责校园网的建设、运行、维护和管理。信息管理部负责学校校级站点的规划、设计、制作与维护及对校内二级网站技术支持,应用系统布署、维护及校内用户的管理工作。鉴于信息管理部所维护的均是业务系统,基本以现职人员为主。但网络运行部管理权限大,涉及线路多,维护覆盖面积广,仅靠现职人员的力量是远远不够的,因此我校又利用特长学生成立了学生管理员团队,协助进行基础网络的维护和故障处理,在一定程度上解决了一部分人手问题。针对相关的网络技术、校园网拓扑结构、各设备部署位置及环境、基础维护知识等,在每一批学生管理团队进来以后,均要进行专门的培训。人员选拔上,每年更替一部分人员,并形成年级梯队层次。日常维护工作中采取以老带新的方法,让有经验的维护人员全程指导新人上手,对故障的处理速度和效率具有决定性的改善作用。

2、注重网络架构和应用系统的顶层设计,先做好建设规划,然后分期实施。在进行网络架构和应用系统的设计过程中,采用了“滚雪球”式的设计方法,即设计的时候既立足于当前成熟的IT技术和架构,又适当超前,每次设计均当成三年发展规划去设计,循环交替进行。这样既能够使校领导站在较全面的角度去看待学校信息化建设和发展,同时又保证了学校前期信息化建设的可持续性和可用性,并兼顾了学校信息化建设短期目标与长期目标、当前投资和长远投资的相对平衡。

3、明确信息化运维需求,科学测算新增项目预算和运维费用,以保证校园网的建设不落后,在上网终端向移动、智能设备转移的过程中依然能够满足信息化多元化的发展需求。学校还专门设置了网络运维预算,将运维中的线路部分维护分离出来,以服务招标形式承包给服务商,从而大大缓解了运维人员的机械性重复劳动,使其将更多的精力投入到“技术性”运维中。

五、高校网络运维的几点建议

1、建设覆盖全校的无线网络系统,并将学校的应用系统APP化,实现各种智能终端的快速、便捷和灵活接入,可以节省很多“计算机系统”维护的人力成本和时间。

2、针对日常的网络运维和系统运维,尽量使用监控运维软件,实现无人值守,且必须配置短信告警、网络拓扑自动发现、资源管理、设备管理、终端管理、性能管理、故障分析、异常流量监测、服务器管理、数据库管理、WEB监控等功能,为各级IT管理人员提供从资源规划、资源收集、性能分析、故障定位与处理、统计分析等管理过程的支持,最终实现“一站式IT运维管理”的目的。

六、结束语

总之,通过建立以业务系统建设为核心,以网络畅通为基础,将网络运维作为一个整体服务校园信息化建设,形成可持续发展的高校信息化发展格局,是整个智慧校园发展的根本保障。只有把网络系统的日常运维上升到智慧校园建设的总体战略层面予以思考、规划、决策并加以执行,才能真正把智慧校园的各项工作落到实处,提高智慧校园建设的总体水平。

相关阅读