首页 >教育信息化 >本期目录>正文

河南工业大学:基于大数据挖掘分析的高校综合治理系统

来源:河南工业大学 作者:付晓炎 隋飞 彭松等 发表于:2018.12.28  768浏览

河南工业大学基于大数据挖掘分析的高校综合治理系统,是在学校已经构建的数字校园的基础上,对各业务系统产生的数据进行交换集成,对高质量的数据进行挖掘分析,以不同主题和层次为校领导、各级管理机构和教师提供实时、全景式的数据分析挖掘和展现渠道,以便及时发现管理与教学活动中的问题和规律,为学校各部门和各学院的决策提供辅助和依据。

一、针对的问题

河南工业大学在信息化建设方面起步较早,并取得了一定成果,已建成大部分部门级业务应用系统,如教务管理系统、OA、财务系统、图书管理系统等,在为各部门的工作提供高效处理手段的同时,也为师生提供了便捷的信息化服务。但随着学校的发展,信息化系统建设逐渐增加,原有的信息化建设格局已不能更好地为师生提供优质服务。主要体现在:

1、存在信息孤岛现象。各单位应用系统彼此独立,通信困难,信息重复管理,数据无法实时更新。对同一个数据,各个系统提供的统计数据不完全一致,信息和资源无法高效共享。

2、存在数据误差和信息不对称现象。由于各业务系统的建立是依据各单个部门的需求,在数据管理方面仅对与本部门有关系的信息进行着重管理,或在管理信息时缺乏有效矫正数据的手段,同时其它单位则难以获取到需要的数据,因此难以形成完整的信息链条,无法为整个学校提供正确的、完整的信息。这在一定程度上制约了工作效率。

3、存在数据利用效率低下现象。各部门大量的业务数据沉积,仅能供个别部门使用,不能进行全面有效的梳理、整合与分析,无法为管理层提供决策支持。

因此,学校亟需在当前信息化建设的基础之上,谋求新的突破与创新,引入更为先进的校园信息化服务理念,构建一套可持续发展的信息化服务体系,提升信息化服务水平。基于大数据挖掘分析的高校综合治理系统采用的面向数据交换、面向消息交换、面向服务交换、面向文件交换的方式,能够打破各个业务应用系统的信息孤岛状态,连接各业务应用系统,汇集各系统教育管理全量数据,构建跨部门、跨系统的数据挖掘分析系统和展现平台。

二、技术方案

基于大数据挖掘分析的高校综合治理系统遵循J2EE标准体系,采用面向服务架构(SOA),以服务总线(ESB)为内核,以消息中间件(MQ)为数据传输总线,融合ETL、Web Services、XML等技术的分布式应用系统平台,通过域模式进行数据交换网络的构建与管理,采用“发布——订阅”机制,以松耦合的方式实现各种不同类型(结构化、半结构化、非结构化)的海量数据安全、高效和可靠地集成与交换,对各业务应用系统之间的数据进行共享集成,为用户提供全局视图、全局数据权限视图和完善的教育数据交换服务,解决各业务应用系统的信息孤岛问题,为统一信息门户、数据挖掘与分析等数据类应用系统提供坚实的数据基础。(见图1、图2)


图1 系统技术方案示意图


图2 系统整体架构逻辑图

1、规范标准,进行数据交换集成

基于大数据挖掘分析的高校综合治理系统通过大型分布式数据交换平台,建成符合国家、教育部和行业标准的、适合学校信息化建设的规范体系,逐步建立和完善有关信息系统建设的各项规章制度和规范,让信息化建设落到实处,做到有章可循,有序建设,从而从制度上保证整个系统的标准化、可扩展性、支持互操作,保证信息化工作的顺利进行。该系统可实现异构数据通信与资源共享,构建统一数据中心的建设,梳理异构数据源,建立数据通信通道,自动集成其他各个业务子系统的数据信息,实时进行数据交互,通过数据交换平台为所有的业务系统提供统一的数据来源,对数据交互的过程进行监控。(见图3)


图3 系统数据交换逻辑图

2、科学分类,开展数据挖掘分析

系统根据数据库中不同类型主题(基本校情、院系竞争力、科研力量、师资力量、资产建设等)和层次(校、院系、专业、班)的多维数据模型,采用在线数据分析引擎进行钻取、上卷、切片、切块,采用数据挖掘引擎进行关联分析、分类、聚类,通过不同类型的图表形式进行数据挖掘分析结果的展示。主要分为学生主题分析、教学主题分析、资产图书主题、人事主题分析、科研主题分析、后勤主题分析、学生预警、上网分析和个人数据服务等九大模块。

(1)学生主题分析:支持各种图形、表格形式,包括在校生情况——从专业、年龄、性别、民族、政治面貌、学历、生源地等不同维度展示,历年各专业学生数量、历年各学科学生数量、历年学生年龄分布、历年学生来源地区分布、历年学生民族分布等分析统计,历年录取分数分析、完成计划情况分析、来源学校分析,预留就业统计分析,分学院分专业学生奖惩助贷数据对比统计,消费习惯分析、消费趋势分析、消费点统计分析等。

(2)教学主题分析:包括从平均成绩、方差、均方差、中位数等多方面数据反映各院系各专业的学生成绩;通过综合成绩、综合绩点成绩找寻全校及各学院的学霸学生名单;展示不同专业中课程科目的成绩排名以及历年变化情况,不同专业中课程科目的挂科率排名以及历年变化情况,考生考场违纪分析,多发考场违纪的课程排名、学院排名、专业排名,历年考试违纪数据预测多发违纪的考试场次;横向对比展示各学院的理论学时与实践学时的比例,按教学课时量对各学院、专业进行排名等。

(3)资产图书主题:按照设备来源、设备类型、设备购置、设备仪器维修等方面统计分析,包括全校及各学院的设备价值生均投入比,分院系持有大型仪器价值与数量对比,大型、贵重仪器清单及使用单位利用率,藏书类别、图书分类、馆藏类别分类统计,历年图书资金投入统计分析,各类图书利用率、流通率、借阅频次排名,图书借阅高发时段,图书借阅量各学院排名统计等。

(4)人事主题分析:支持各种图形、表格形式,包括以专业、年龄、职称、性别、民族、第一学历、最高学历、是否双师等不同维度展示教职工信息,支持教职工总量情况、教职工职称情况统计分析,从毕业院校、双师教师、最终学历、专业背景等方面分析教职工学缘结构,从毕业院校的类型与地缘属性分析教职工地缘关系,从文理背景、文化背景、专业背景、学科分类背景展示学校及各院系师资队伍建设水平。

(5)科研主题分析:包括科研机构概况、科研人员基本情况、科研项目基本情况、科研成果基本情况以及科研经费使用情况分部门纵向、横向比较,按照成果级别、获奖级别分学院科研成果纵向、横向对比,按照获奖成果、科研论文、科技著作、专利、科研项目数各科研单位和个人排名统计,超期科研项目统计及最近两年获得省级以上的科研项目成果情况等。

(6)后勤主题分析:包括宿舍入住率分析、宿舍出入分时段统计、宿舍楼入住统计、学生宿舍入住明细分析、各学院学生宿舍分布、宿舍各院系入住组成占比统计,就餐人数统计、餐厅月消费分析、分时间段就餐次数统计、各卡机消费情况统计、学生消费按餐厅排序、个人每餐消费额、生均每月消费额等,各购物点人数统计、月消费分析、学生消费按购物点排序等。

(7)交叉、预测分析:包括学生成绩与图书借阅相关性分析、学生成绩与图书馆进出次数相关性分析、学生成绩与早餐次数相关分析、教职工职称与科研成果相关性分析、今后2年科研产出预测、教职工来校年份与科研成果相关分析、引入人才方式与科研成果相关分析、不同学科科研成果产出分析、资产投入与科研产出比、教学任务量与科研产出分析、学生成绩与教师课程以及职称相关性、低消费学生与助学金发放的交叉分析,学生疑似未住宿预警、学生疑似不在校预警、学生晚寝晚归预警、学生低消费预警、学生预警每月关注TOP10、学生预警趋势分析、学生就餐高峰、洗浴高峰预警、学生学业预警等。

(8)上网分析:包括上网时长分析、上网时段分析、上网次数分析、分学院上网行为分析、分专业上网行为分析等。

(9)个人数据服务:包括教师数据全景分析——教师工作时间轴、教师工资增长曲线、收入预测、学生班级成绩分析,学生大学生活全景展示、学生关系网、学生轨迹分析等。“我的大学生活”应用针对毕业生开放,从学生在校生活的多个方面向毕业生展示他的大学时光。

三、阶段性成果与创新点

1、阶段性成果

(1)建成数据挖掘分析系统、数据交换集成系统、个人数据中心等。2016年12月7日,学校数据挖掘分析系统上线试运行,实现了教务系统、财务系统、资产系统、科研系统、后勤系统、图书系统、一卡通系统、上网认证系统等数据自动交换集成。基于集成数据的新统一身份认证系统开通,个人数据中心和数据挖掘分析系统启用。

(2)建成一站式综合信息服务门户。2017年1月4日,新一代服务门户系统上线试运行,实现了13个应用系统的单点登录,以及来自各系统的344项服务的拆分、集成、重组,建成聚合管理、教学、生活一站式服务的综合服务平台。

(3)建立了一套信息标准体系。制定了《河南工业大学信息分类编码管理办法(试行)》及《公共基础信息分类与代码》、《教职工号信息分类与编码标准》、《本科及专科学生学号信息分类与编码标准》、《单位信息分类与代码》四个标准,明确了编码规则管理、保密和执行规范等,使信息能够更加有序流通。

2、创新点

(1)实现资源共享,建成智能环境。以先进的网络技术为基础,构建教学、科研、管理、校园生活为一体的新型智能化环境。通过数字化校园中各个应用系统的紧密联结实现资源共享、信息共享、信息传递和信息服务。

(2)优化综合治理,辅助科学决策。将管理和业务流程再造,作为制度创新、管理创新的重要内容之一。提供可定制的、智能化的综合数据分析应用,为各种决策提供最基础的数据支撑,实现科学决策。

(3)提供综合服务,探索创新模式。提供面向师生的综合信息服务,使得全校师生能快速、准确的获取所感兴趣的服务。探索出一条结合目前主流信息技术和教育改革发展的需要,以服务为本的信息化建设之路。学校通过该项目,科学梳理信息化业务管理,整合已建成的信息化资源,充分发挥信息带来的便利服务功能。

四、下一步计划

优质的数据和广泛的服务是实现大数据综合利用的重要内容,该项目下一步将着眼于进一步提高数据质量,通过多种途径开发跨业务的应用,利用物联网和人工智能技术增加智慧服务项目,不断积累更多数据,开发、提供更加丰富的数据服务。

1、健全数据管理体系,不断提高数据质量

一是加强对主数据的管理。保证各个异构业务应用系统使用的主数据是统一的并且是唯一描述的,保证各个异构业务应用系统使用的主数据及时更新,满足各个异构业务应用系统能够方便地共享和订阅数据、各业务应用系统的个性化数据订阅等需求。

二是加强对元数据的管理。提供统一的元数据视图,统一数据口径,系统性地管理来自各个业务应用系统的海量数据,梳理业务元数据之间的关系,完善对数据的解释、定义,形成一致、统一的数据定义,并对这些数据来源、运作情况、变迁等进行跟踪分析。

三是通过数据治理工具提高数据规范性。使用工具对数据进行自动检查和预警,对不规范数据进行自动提取、归类、通报,提醒管理人员查找原因,进行处理,并根据系统需求提出修改方案。

2、开发跨业务的应用,提供丰富的数据服务

一是部署业务流程管理系统,开发跨部门服务。与服务门户紧密结合,依托现有各项服务和基础数据,开发一批跨业务系统的工作流程,减少师生跨部门办事的困难,为师生提供方便快捷的服务。

二是利用物联网和人工智能技术,开展智慧服务项目。积极利用无线WLAN、手机NFC、蓝牙、射频RFID等物联网技术,以及指纹识别、人脸识别、虹膜识别等人工智能技术,结合大数据平台和服务门户,广泛设计和开展智慧服务项目,为管理部门和师生提供更多管理、服务的条件和方式。

推广使用情况

基于大数据挖掘分析的高校综合治理系统自2016年上线应用以来,系统功能不断丰富,在本校进行了广泛应用,在部分高校进行了推广应用,也为大批兄弟高校开展大数据建设提供了参考借鉴。

1、在本校范围进行了广泛应用。河南工业大学全校师生共计30000余人应用该系统。各管理部门使用该系统进行目标考核、教学管理、科研分析等,为科学决策提供数据支撑和辅助依据。面向师生的综合信息服务使全校师生能快速、准确的获取所感兴趣的服务。系统服务于教育教学,提供有力的数据服务支撑,支撑了专业建设,如在材料学专业工程认证中,评审专家对数据分析系统的功能和作用给予了高度评价。

2、在部分高校进行了复制推广。部分同类高校参考该项目思路和模型,对本校的数据挖掘分析和综合管理服务等平台进行了不同层面的更新、升级、二次开发,如郑州轻工业学院参考更新了服务门户的设计、河南农业大学参考更新了数据分析项目等。

3、为省内外高校提供示范借鉴。系统建成以来,先后接待了省内外50余所高校参观考察,为各兄弟高校展示了基于大数据挖掘分析的综合治理系统建设应用成效,对高校教育信息化建设的推进起到了示范作用。(本项目获得“2018年度河南省教育信息化优秀成果奖(创新应用类)”一等奖。)

相关阅读