青年|高校数据治理常见挑战与对策


高校数据分析最早是 IT 人员用于改进学校信息化基础设施的管理运用 , 现在越来越多的学校开始使用数据分析来帮助推动学生获取成功 。
以数据分析项目为代表的数据治理领域已经成为全球高校信息化发展的新热点 。 “大数据和学习分析的使用会改变教育领域” ,这已经成为众多高校领导人的共识 。 在高校开展数据治理时会遇到一些挑战(如数据质量、数据获取权限、数据运用伦理) , 先行者们也已经探索出一些解决之道 , 提出了数据治理成功的关键因素 。
高校数据治理常见挑战与对策
在谈到高校数据治理实践时 , 一些受访者提出常遇到如下的挑战:
挑战 1:如何让各级领导层建立数据分析思维?
很多领导只是把自己作为数据的消费者 , 等待技术团队提供可用的直观工具 。 但是一个机构要实现数据治理 , 是需要业务部门提出需求和想法 , 并参与数据分析工具的设计与开发的 , 为此 , 就需要各级领导参与相关的培训首先从建立数据素养和数据分析思维开始 , 提出业务工作中想利用数据解决的问题 。

对很多大学来说 , 数据治理需要梳理决策逻辑、清理数据 , 从哪个业务先开始往往不能统一意见 。 据 2018 年 6 月美国的一项 200 所高校领导人调查发现 , 教学部门(如校长、教务长)会更关心学习产出、学生保持率和毕业率 , 信息技术部门则更关心如何提高大学的运营效率 。 在实践中 , 可行的做法是优先与能够应用数据分析解决问题的团队合作 。
青年|高校数据治理常见挑战与对策
本文插图

加州州立大学长滩分校(California State University ,Long Beach)利用数据来提高毕业率 。 2015 年 , 启动了the Data Fellows program , 一个 55 人的团队两个月开一次会 , 讨论与学生学业成功相关的指标 。 这个团队成立的目的是建立数据所有权文化 , 形成推动变革的解决方案 。
在长滩分校 , 四年毕业率在过去两年(2016~2018) 从 16% 跃升至 28% , 与此同时 , 少数族裔和非少数族裔学生的毕业率差距从 12% 下降到 4% 。
挑战 2:如何保证所基于的数据具有高质量?

基于数据决策的前提是数据可靠且相关 , 数据必须是“真实可信的” , 否则“输出将是误导和无效的” 。 但是学校所收集的数据可能不完全 , 或者更新不及时 。 不完全的数据 , 特别是不准确的数据 , 可能会带来更危险的决策 。 但是 , 所收集的数据来源多样 , 种类丰富 , 也很容易出现同一个数据(比如一所高校的在校生人数) 从不同的部门得到的数值不一样的情况 。
IBM 认为 , 高质量的数据具有以下四个特征:
完整性(Completeness):要从所有可能的来源中关联相关的数据 。
准确性(Accuracy):数据必须是正确的、一致的 , 没有输入错误 。
可用性(Availability):数据必须在需要时可以获得 。
时效性(Timeliness):当下的数据必须可以获得 。
为了提高数据的质量 , 可能需要多管齐下 。
首先要制订数据治理政策 ,其次要开发和部署专门的工具来简化数据收集过程 。 美国的大多数高校会选择数据质量工具通过数据清理、匹配、监控和其他方式 ,让质量保证过程自动化 。
青年|高校数据治理常见挑战与对策
本文插图


2013年圣母大学(University of Notre Dame)建立了商业智能(business intelligence)项目dataND, 经过摸索 , 发现制订数据治理政策非常有必要 , 即要定义数据是什么 , 如何使用这些数据 , 谁应该有权访问这些数据 。 其经验总结如下:
1.如何统一数据定义:雇佣了一个数据治理管家(a campus data steward)在部门之间协调 , 建立关于数据的共识 。


推荐阅读