不忘初心:高校大数据工作最终目的是提高教育教学质量——访周口师范学院网络管理中心主任刘伟教授
来源: 作者:本刊 发表于:2017.03.31 3738浏览
周口师范学院在数字校园建设中按照“三统三集”的原则实现了学校各个应用系统的互联互通和数据共享,通过数据挖掘推动应用融合,将数据挖掘结果应用于包括移动终端在内的多个平台,服务学校管理和决策,服务学生成才成长。学校信息化建设与应用的案例受到多家国家和省级媒体报道。2014年,省委常委、宣传部长赵素萍来校调研工作时指出:“学校注重运用科技手段,助推治理体系和治理能力现代化,走在了全省高校的前列,为全省高校加强治理体系建设提供了有益借鉴。”以下为本刊对周口师范学院网络管理中心主任刘伟教授进行的专访实录。
《河南教育信息化》:高质量的数据清洗工作是保证数据分析准确有效的前提。高校该如何认识和做好数据清洗工作?
刘伟教授:大数据要服务师生、服务决策,数据质量需要保证,需要对采集的数据进行治理。目前,很多高校数据中心收集到的数据质量同发达国家高校相比有差距。我认为数据清洗将是一个系统、持续、长期的工作。
首先,就数据收集方面,随着大数据工作的推进,我们服务于更多的院系和部门,大数据带来的效果越来越明显,必将会有更多的用户、部门愿意把数据提供给我们。比如,近期校内就有多个部门愿意将健康体质测试、就医等数据提供给我们,我们在对数据进行脱敏处理后,进入大数据平台进行相关分析。原来不愿意提供的数据,现在愿意提供,原因就在于相关部门看到了我们大数据分析的内容,并认可其价值。所以可收集的数据源会越来越多,而我们需要对每个数据源做清洗,清洗的工作量在一定时间段内会持续增加。
第二,就单个数据源讲,由于系统管理问题、数据维护人员的责任心问题以及数据本身的问题等会给数据清洗工作带来很大的麻烦。我们现在的平台收集到的数据也有一部分质量堪忧。有一种观点说:我的数据不好我先等着,什么时候数据100%正确了再给你去分析。我的想法是不能等,先把平台搭起来,数据先收集上来,通过数据清洗先解决一些数据质量问题,通过相关系统数据交叉分析反馈再解决一些数据质量问题,把大数据先应用起来。如果等待观望,可能会错过很多过程数据,也会错过大数据的及时应用。
所以说,数据清洗是一个长期的工作,而且在一定的时期内工作量会日益加大。但是我认为,数据清洗最终会达到一个平衡:一方面新的数据源源不断,增加了数据清洗工作量;另一方面,由于大家对数据重视,数据质量会越来越好,减少了数据清洗工作量;最后数据清洗工作会达到相对平衡,但是不会消失。
《河南教育信息化》:高校如何有针对性地选择数据清洗平台?
刘伟教授:大数据分析工作会牵涉到很多工具的选择问题,数据清洗也需要有一定的工具,数据清洗平台很多,有开源的,也有成熟的产品,也可以外包给公司。我个人倾向于外包,我们只提出数据清洗需求,至于使用什么样的平台,由公司决定。但就数据治理而言,我觉得重要的是人,不是技术,因为数据的生产者、维护者是数据质量保障的最重要因素。
《河南教育信息化》:您怎么评价周口师范学院目前的教育大数据工作?
刘伟教授:做事不忘初心。如果高校大数据工作最终没有达到提高教育教学质量的目的,或者说没有服务学生成才成长,这样的数据挖掘及应用工作的成效并不能说好。
就周口师范学院而言,我们已经推出了多个大数据的应用,师生和学校相关部门也已经在使用:如学生成绩的分析得到教务及学生管理部门认可;一卡通消费习惯分析得到财务及后勤部门认可;图书借阅数据的分析得到图书馆领导认可;学生日常行为分析及奖惩助贷分析得到了学生管理部门认可。
但是,我们更希望关注教学的大数据分析。教学的大数据能不能帮助老师和各个院系去提高教学质量,这是最关键的:例如利用大数据分析哪些是好的学习习惯、哪些是影响学习的,推送给学生,服务学生成才成长;例如利用大数据分析不同属性学生学习过程及学习成绩的差异性,推送给院系和教师,改进我们的教学。
教学大数据需要交叉分析的很多,我们现在的思路是:找点、抓需求,和需求部门一起搭建模型,确定之后把模型做到大数据平台中,作为固定的模块提供给老师和相关部门。根据使用效果随后在其他院系逐步推广。现在的分析还是需要依托公司根据模型去固定分析某些课程,然后设计到产品里。我们希望未来能想办法实现老师可以自己去分析数据,突出个性化需求。
《河南教育信息化》:周口师范学院下一步大数据挖掘工作的重点是什么?
刘伟教授:近期重点做教学相关分析。目前我们已经实现了一些功能,主要提供给教务处。下一步工作会继续导入同教学相关的数据,充分交叉分析,并依据权限提供给相关院系部门及人员,使大数据在提高教育教学质量上发挥越来越重要的作用。
《河南教育信息化》:就周口师范学院的大数据工作,您相对满意或者说成效比较明显的是哪些方面?
刘伟教授:从反馈看,学生管理方面的大数据工作成效比较明显。目前我们主要实现了以下功能:一是记录学生各种行为习惯,然后根据这些习惯做一些分析,比如就餐习惯、消费习惯等生活习惯的分析,然后把这些分析结果以预警的方式反馈给辅导员或者主管学生工作的院系副书记。形成了一个这样的闭环之后,大数据就可以用于对学生进行辅助管理。
《河南教育信息化》:您说过,大数据分析的魅力就在于交叉分析会找到意想不到的结果。那么目前我们学校交叉分析应用最多的地方在哪儿?
刘伟教授:大家反馈较好的是学生行为习惯分析。现在我们可以推送给学生他的行为习惯。同时我们还推送他和同班同级“学霸”的行为习惯对比,告知他的行为习惯在同级同班排名。通过调查,我们发现学生对这个功能感兴趣,觉得很有意思。我们自己觉得交叉分析比较多的还是偏重于教学方面。