文/王细薇 河南城建学院信息化处副处长、河南省校园智慧应用工程研究中心成员
闫涛 河南城建学院信息化处处长、河南省校园智慧应用工程研究中心主任
陈赛飞扬 河南城建学院信息化处科员、河南省校园智慧应用工程研究中心成员
摘要:随着教育信息化的深入推进,各个高校都积淀了海量的非结构化数据,但存在资源得不到有效沉淀的问题,且伴随数据丢失和泄露的风险。“云盘”技术能够很好地解决非结构数据的存储、共享和应用问题。河南城建学院探索使用“云盘”技术,构建了校本非结构化数据资源中心,采用私有云部署方式,实现学校内部文档文本存储共享有序进行。
关键词:非结构化数据;云盘;云存储
随着教育信息化的深入推进,各个高校都积淀了海量数据。对于业务系统内的结构化数据,高校通过建设各类数据平台,如基础数据库、共享交换库、中间库、数据中台等,以支撑数据的共享和应用。但高校还存在大量的非结构数据,这些数据有源头多样性、结构多样性、类型多样化等特征,部分数据还具有保护要求高等特性,非结构数据的存储、共享和应用成为了新的亟待破题的挑战。
一、高校非结构化数据存储和共享现状
高校中的非结构化数据主要包括教学和管理活动中产生的音视频资料(包括但不限于教学、讲座、会议、学生活动等的音视频资料)、图片资料(包括但不限于涉及校园风光、重要活动、实验、教学、社会实践、实习实践等的图像资料)、文档资料(包括但不限于学术论文、教学文件、管理文件、试卷、教材、课程平台内容等文档形式的数据)。
这些非结构化数据因其格式多样、内容丰富,对高校的教学、科研和管理工作具有重要的价值,但同时也带来了管理和利用上的挑战。当前,相当一部分高校并没有建立集中的非结构化数据的存储利用管理办法。大量的非结构化数据,尤其是文档资料,多以“附件”的形式存在业务系统或者邮件系统里,以文件的形式存在办公或者个人电脑里,以档案的形式存在光盘、移动硬盘或者U盘里,没有发挥其应有的价值。共享的形式大多是附件、U盘甚至通过社交媒体,有些文档甚至直接用群共享的形式进行。高校需要建立有效的非结构化数据管理机制,以实现非结构化数据的集中存储、安全共享以及未来的数据挖掘。
二、非结构化数据的管理策略和实践
在信息化建设实践中,对非结构化数据的处理,一般通过建立非结构化数据中台,对非结构化数据做定义和分析,通过自动化工具或AI技术,对非结构化数据进行分类,将类似类型的数据归类在一起,并添加语义或描述性标签,帮助高校实现集中管理和共享非结构化数据资源,提高数据利用率和价值。这种方法在教学资源平台建设方面取得了较为明显的成功,比如MOOC/SPOC的应用。有的学校建设了教学资源中心,将教学资源生产场景及使用场景实现集成。通过教学资源中心实现对教学视频、课件、音频、图片及文档等非结构化数据进行统一存储、统一计算、统一服务,为师生提供丰富的资源应用服务。但这种方式在处理文档数据时存在一定的不足。大部分的文档数据,尤其是管理过程中产生的文档并没有清晰的场景、标签和关键词,若按照上述方法处理,将文档纳入系统的工作繁多,共享效果不佳。
在高校的管理工作中常有类似收发作业型的文档汇集的场景,如某项工作要求各个基层单位上交材料,目前的形式常常是发出通知,基层单位以OA协同或者邮件的形式回馈,通知发布人员在OA或者邮件系统一个个地下载相关附件,找出未提交单位进行二次通知,然后汇集相关文档,工作效率较为低下。个别单位还可能出现使用社交媒体传递文档的情况,相关文档数据的存储、共享不能有效地管理,更不用说形成单位的知识社区了。针对上述问题,河南城建学院探索使用“云盘”技术,构建了校本非结构化数据资源中心,一方面要求校属信息系统在校本“城建云盘”上做数据备份,另一方面以校内统一身份认证为入口,开通了单位和个人的存储空间,实现学校内部文档文本存储共享有序进行,一定程度上实现了文档数据“存得稳、管得住、找得着,有价值”的工作目标。
三、基于云盘架构的校本非结构化数据管理和共享的探索
1.校本非结构化数据资源中心“城建云盘”架构设计
2024年河南城建学院和河南联通平顶山市分公司合作启动建设校本非结构化数据资源中心“城建云盘”,采用私有云、对象存储、多站点及多文档域等部署方式,实现服务级、微服务伸缩扩展,部署在5台服务器中,一期总容量1060TB,服务器部署在校园5G专区上。开通5G专区的师生可以实现校园网外网文档共享,其他用户只能在校园内网使用。
(1)提供十万级用户的访问能力。采用服务器集群技术,支持海量数据,满足目前及未来发展的需求,运营成本低。
(2)分布式存储架构。系统所有的硬盘性能聚集到一起,可以将存储系统的性能扩展到TB/s的传输速度。并且分布式存储架构系统采用多副本安全机制,可以做到磁盘和服务器故障时,业务不中断,数据不丢失。
(3)支持Windows、Android、iOS系统的PC和移动设备在本地客户端访问。系统具有丰富的预警功能,管理界面友好。
(4)提供分布式存储服务。支持桌面数据同步、备份,以及跨本地桌面系统、虚拟化桌面系统、移动终端系统的数据统一管理。
图1 “城建云盘”部署拓扑图
2.对接学校统一身份认证平台“我i城建”和企业微信
对接统一身份认证平台后,师生可以直接在“我i城建”和企业微信多终端访问(手机端、浏览器、PC端)使用云盘。
图2 “我i城建”端云盘服务
图3 “企业微信”端云盘服务
3.校本非结构化数据资源中心“城建云盘”应用场景
(1)为教师、学生提供文件存储服务
传统的教学活动中,教师常常需要随身携带U盘,以确保出差或居家办公时能够访问所需资料。而通过“城建云盘”,可以实现海量资料的在线存储和云端/本地文件的实时同步,师生无论何时何地,都能通过手机、电脑获取最新文件。将云盘上的文件或文件夹同步到本地电脑,本地文件的任何修改都会自动更新至云端的同一份文件,反之亦然。最后,通过搜索文件名称、关键词、类型或使用以图搜图等功能,可以迅速定位到所需的文件。
图4 云盘文件同步到本地
(2)为教学、科研提供在线协同
通过微信、邮箱等方式逐个接收学生的作业、论文或新生入学资料,不仅需要手动下载、归档和统计提交进度,一旦发现有学生超时未提交,还需要一对一进行催促,过程既耗时又费力。而“城建云盘”的实施极大地简化了这一流程,教师可以在云盘中创建作业文件夹,生成提交链接,学生通过链接直接上传作业,实现了作业收集的自动化和无纸化。此外,教师还可以将课件、视频等教学资源上传至云盘,并设置相应权限,不仅提高了资源分享的安全性和便捷性,也减轻了教师的管理负担。
图5 上传作业等资源到云盘
(3)数据追溯历史可查
云盘的版本控制功能能够详细记录文件每一次的修改。用户可以随时查看和恢复到之前的版本,有效防止数据丢失和错误修改。此外,所有的文件操作,包括上传、下载、修改等,都会被操作日志记录下来,有助于追踪文件的使用情况和历史变更。当数据被修改并保存后,云盘会自动生成新的版本,同时保留旧版本,确保用户在需要时可以通过点击版本号下载旧版本内容。每一个版本都详细记录了修改时间和修改人,使得历史数据可追溯。
图6 文件历史变更与还原
(4)大文件传输
在教育和科研领域,传输教学视频、学生毕设作品、科研项目文件资料等大文件常常面临困难。传统的微信、QQ、邮箱附件等形式不仅上传发送速度慢,还经常导致传输失败。而“城建云盘”的实施显著提高了传输效率,其支持的高速上传和下载技术使得大文件也能在短时间内完成传输,大大节省了等待时间。
(5)深度推进无纸化办公
在“城建云盘”上点击“分享”按钮,可快速生成分享链接或二维码,实现文件的快速共享,真正实现“让你的文件跟你走”,减少了大量文件的打印及移动存储的使用,深度推进无纸化办公。
图7 生成分享链接或二维码
四、结束语
高校数据共享的出发点和目的地就是全面提升师生满意度和幸福感,并贯穿教育管理服务的各个阶段。随着校园各系统的深度应用,校园数据持续井喷,数据孤岛现象、办公效率低下和安全问题日益凸显,河南城建学院借助云盘的灵活存储、细致管理、安全策略、协同能力等能力,实现教育资源共建共享,沉淀教学数据,提高了学校智慧型、数据化、网络化、协作型一体化的管理能力。(项目:数智赋能应用型高校智慧学习社区构建的研究与实践,项目编号:2024SJGLX0469。)