数据可视化技术提升高校教育教学治理能力的研究
来源:本站 作者:李蒙 洛阳理工学院计算机与信息工程学院 发表于:2022.06.28 389浏览
文/李蒙
洛阳理工学院计算机与信息工程学院教授
一、引言
高等学校的办学层次、招生规模、专业设置等教育教学核心要素,受到学校自身发展的历史沿革、社会经济发展对人才的需求、学生个体自身发展需要等多种因素的制约。每年新专业申报、制订年度招生计划,如何能立足学校师资现状、满足国家经济社会发展对人才的需求以及尊重学生个人的发展愿望,这对高校教育教学管理的决策部门提出了挑战。
教育部在2006年委托上海市教委高教处牵头,由上海市教育评估院和上海部分高校联合研发了单机版本科教学状态数据库,到2011年6月全面启动全国高校教学基本状态数据采集工作,高校教学基本状态数据库建设已经日趋成熟,各个高校也拥有了自身教学基本状态的数据,并开展了一些有意义的数据挖掘与分析。然而用“高校教学基本状态数据”为关键词在CNKI检索(时间节点2022年4月1日),仅仅有期刊论文28篇,学位论文1篇,研究多集中在教学质量监控、审核评估等方向,因此针对高校教育教学数据挖掘与分析,改进教育教学要素分配与决策是亟待深入研究的方向。
二、教育教学数据可视化系统的设计思路
高校决策部门一直以来也运用教学基础状态数据开展数据挖掘与分析工作,如从2013年开始,每年都要全国各高校撰写本科教学质量报告,这已经成为一个常态化工作。然而几十页的报告是否能为下一年度教育教学要素分配、专业建设、招生规模等核心议题,提供高效准确的决策支撑,涉及到教学数据如何呈现这个关键问题。
首先文字、表格给读者带来的视觉冲击与直观印象都不够深刻,很难激发内生的决策动力;其次常用工具软件绘制的图表,往往不方便去挖掘数据背后的本质与内在联系,无法支持决策者科学决策;再次就是现有的图表呈现方式,大多无法提供交互与动态查询细节的能力,不便于决策者深入研究核心数据。而数据可视化为教育教学数据挖掘与分析提供了更多的视角。
数据可视化工具可选择非常之多:在线服务有免费的RAWGraph(https://rawgraphs.io/),收费的ChartBlock(https://www.chartblocks.com/)等,客户端的数据可视化工具有Tableau与微软的Power BI等。这些工具优点是零编程,缺点是收费,且定制性与灵活性都无法满足高校数据可视化的需求。因此开源的Python为高校数据可视化呈现提供了一个可选项。由于Python符合自然语言习惯,上手极快;其次由于开源,有众多数据分析模块如:Numpy、Pandas等,且拥有大量数据可视化模块如:Bokeh、Pyechart、Plotly等;再有就是Python很容易与各种数据文件同步,便于可视化数据的实时网页发布与动态展示。通过Python构建的高校教育教学数据可视化系统具有数据自主、工具自主、挖掘与分析自主等特点。
三、教育教学数据可视化系统的实现
1、数据可视化系统体系建构
系统分两个模块:年度教育教学运行数据模块、当前教育教学运行数据模块。年度数据模块依据高校本科教育质量报告的结构,分为以下七个数据可视化展示子模块:本科教育基本情况、师资与教学条件、教学建设与改革、专业培养能力、质量保障体系、学生学习效果、特色发展,数据来源为高校教学基本状态数据库,通过数据可视化呈现,为长期战略决策提供数据可视化支持。当前数据模块根据学校运行核心要素构建,分为以下四个子模块:教学运行模块、招生就业模块、师资结构模块、绩效模块,数据来源为各个职能部门收集汇总,通过展示实时教学运行状态,为学校近期战术决策,提供数据可视化支持,也为学生个性化发展与选择提供数据支持。
图1年度教育教学运行数据模块
图2当前教育教学运行数据---整体情况与当前评教评学情况
图3当前教育教学运行数据---各学院本年度师生互评情况
图4当前教育教学运行数据---四种班型三类课程统计图
2、数据可视化系统的实现
为了提供实时、透明的数据可视化服务,教育教学数据可视化系统要实现在线发布。网站服务器的架设与部署不再赘述。仅仅对数据可视化系统的实现过程进行阐述。首先在服务器上安装Anaconda,通过condas install xxx命令,完成Python、Bokeh、Pyechart等模块的安装。运行模式为bokeh serve xxx/ 提供Bokeh数据可视化服务,运行架构为main.py执行主程序,templates目录下index.html实现主页呈现与内容管理,其他HTML文件页也放于此目录下管理与维护,Static目录存放CSS模板,data目录存放统计数据,动态日期目录用于存放实时数据,通过上传实时数据,实现图表的动态更新。
四、教育教学数据可视化系统应用
1、服务于管理层决策
高校的专业布局要考虑的诸多因素之一,就是满足学生自身发展的需要。绝大多数高校已经放开了转专业的限制(除跨录取批次与类别),给了学生二次选择的机会,这次选择也是对高校各个学院与各个专业办学效果的一次用脚投票。因此分析转专业数据,对专业申报与各个专业的招生规模设置具有借鉴意义。通过教务处公示的转专业名单,用下面的Python代码,就可以呈现图5所示的各专业转入转出对比图。用转入学生降序加转出学生升序排列,可以直观反映出各个专业受欢迎的程度,但无法体现学生流动的细节。再改进程序,设计出如图6所示的桑基图,图中学生专业间流动的细节信息一目了然,展示了数据的内在联系,呈现出更本质因素。
import xlwings as xw
import pandas as pd
from bokeh.plotting import
figure, show,output_file
from bokeh.models import
ColumnDataSource, Label
from bokeh.transform import
dodge
from math import pi
students_cm_df=pd.read_excel('word_cloud.xlsx',sheet_name='SCM')
exM_name=list(students_cm_df.groupby('转出专业').count().index)
exM_num=list(students_cm_df.groupby('转出专业').count().序号)
exM_pd= pd.DataFrame({'专业':exM_name,'转出人数':exM_num})
imM_name=list(students_cm_df.groupby('转入专业').count().index)
imM_num=list(students_cm_df.groupby('转入专业').count().序号)
imM_pd= pd.DataFrame({'专业':imM_name,'转入人数':imM_num})
ex_imM_pd=pd.merge(imM_pd,exM_pd,how='outer',on='专业')
eximM=ex_imM_pd.sort_values(by=['转入人数','转出人数'],ascending =
[False,True])
eximM.fillna(0)
source_im =
ColumnDataSource(data=dict(x=eximM.专业, y=eximM.转入人数))
source_ex =
ColumnDataSource(data=dict(x=eximM.专业, y=eximM.转出人数))
Tooltips = [('学院', '@x'),('人数', '@y')]
pb = figure(x_range=eximM.专业, height=550,
plot_width=900,title='2022年各专业转入\转出学生数量对比图', tools =
"pan,reset,save",tooltips=Tooltips)
rim=pb.vbar(x=dodge('x',
-0.15, range=pb.x_range), top='y', bottom=0,width=0.3, fill_color='#1F77B4',line_color='white',alpha=1,source=source_im,legend_label="转入专业")
rex=pb.vbar(x=dodge('x',
+0.15, range=pb.x_range), top='y', bottom=0,width=0.3, fill_color='#E14D21',line_color='white',alpha=1,source=source_ex,legend_label="转出专业")
pb.title.text_color =
"red"
pb.title.text_font =
"times"
pb.title.text_font_style =
"bold"
pb.yaxis[0].axis_label = '人数'
pb.yaxis.major_label_orientation
= "vertical"
pb.yaxis[0].axis_label_text_font_style
= "bold"
pb.xaxis[0].axis_label_text_font_style
= "bold"
pb.xaxis.major_label_orientation
= pi/4
citation = Label(x=20,
y=300, x_units='screen', y_units='screen',
text='最受学生欢迎的专业!',
render_mode='css',
border_line_color='black',
border_line_alpha=1.0,
background_fill_color='white',
background_fill_alpha=1.0)
pb.add_layout(citation)
pb.legend.location =
"top_center"
output_file("pandas_students_change_major_M.html")
图5 2022年各专业转入\转出学生数量对比图
图6 2022年各学院转专业桑基图
2、服务于学生选择与决策
教育教学数据可视化,不仅仅服务决策部门,也可以为学生选择提供数据支持,比如近一年的招生计划就可以为下一个年度咨询提供服务。通常招办网站的数据表格很容易看错行,且不便于检索,如图7用地图做可视化的数据呈现,能够让考生根据自己所在地区实现快速检索,服务了招生咨询工作;图8用环状楔形图直观呈现各个专业的毕业率与学位授予率,也为学生专业方向决策提供数据支持。
图7 2021年招生计划---示意图
图8 2021届毕业生毕业率与学位授予率
2022年全国高校毕业生规模1076万,其中本科生471万,高职/专科516万,研究生89万。2022年6月份,教育部不断出台促就业的各项政策,服务广大毕业生,然后如果在2021年9月,在半数本科在校毕业生选择考研的时候,能通过近三年报考研究生与录取情况的数学模型,给出准备报考考研的学生一个可信的预测,即考研成功率画像,90%概率考上的学生五个维度数据、90%概率落榜学生的五维度数据展示,是否就可以在更早的时间节点,让学生做出正确的选择,为就业做好准备,让学校从课程设置上为就业做好准备,及早培养学生敬业与乐业的积极就业态度。因此可见提升高校数字治理,也是为社会经济稳定发展做出积极贡献。
图9 报考研究生学生录取预测雷达图
五、结束语
2022年教育部工作重点明确指出:全面推进高等教育教学数字化、提升数字化应用能力、提升数字化治理水平。6月9日教育部党组在《人民日报》撰文《筑牢教育强国建设之基》指出:以推进信息技术应用为抓手,进一步推动教师队伍建设提质增效。可见落实高校数字治理水平提升已经是当务之急。
农业社会,谁拥有土地,谁就拥有了核心生产资料;工业社会,谁拥有天然动力资源,谁就拥有生产力;信息技术社会,谁把握高新技术,谁就掌握第一生产力;然而在数据时代,谁能智慧应用数据,谁才能把握未来。高校数字化治理能力提升,有助于提质增效,有助于深化高校综合改革,有助于更好地服务师生,更高质量地服务社会经济发展。挖掘教育数据成就一流教学,智慧应用数据驱动转型升级。通过挖掘与分析教育数据,探索事物的本质,寻找教育教学的内在规律,为高校全面深化改革提供决策依据,助力高校更优化地配置教育资源、更合理地规划专业布局、更长远地建设师资队伍,全面提升教育教学效果、提升教育教学资源运作效率,全面落实高校人才培养、科学研究、社会服务、文化传承创新等基本职能。(基金项目:河南省教育科学“十四五”规划2021年度基础教育专项课题(2021ZJ13) :以“数字素养”为主题的教师学习共同体建设研究)
点击图片,进入本科教学运行可视化系统
参考文献:
[1]KevinJolly.Hands-On Data Visualization with Bokeh [M]. UK.Birmingham: PacktPublishing Ltd,2018.
[2]SSSimonYang.2020-006用桑基图分析转专业数据[EB/OL].(2020-08-11).https://www.jianshu.com/p/391f288841dd.
[3]李蒙.基于内涵建设的地方高校转型发展再思考——洛阳理工学院转型发展探索与实践[J].河南教育,2015.(12):3-4.