发布于2017/03/16

学习分析:从幕后走出来

10bet娱乐成代理进化论|学习分析:从幕后走出来
随着大数据和分析越来越成为高等院校学术和官僚部门管理的核心,领导者处理算法偏差、透明度、数据所有权等问题至关重要。

近几年来,学习分析已成为人们关注的一个主要焦点。[1]它将大数据及其相关统计建模的期望从云端带到了校园。虽然其中大部分都是重新包装的学术分析,旨在阐明影响四年毕业率和逐年留校率的因素,但它提供了对干预措施发展的见解,这些干预措施已开始影响学生的成功。[2,3]

这方面的进展很大程度上是通过利用机构收集的数据,但往往未能有效地挖掘这些数据。这些分析正在改善课程路径的导航,并确定学生在阻碍专业成功发展的瓶颈课程中有失败的风险。只需确定高年级学生完成最后一年所需的课程,并提供给他们,对完成任务产生了非常积极的影响。

然而,一个新出现的问题是在学习机构之外收集和存储学生数据。系统是否在“外面”运行以保护PII(个人识别信息)并将其用于其他目的从未打算供学校使用“?[5]像这样的问题促使世界各地大学的学者和管理者去年聚集在加州海岸,制定一个框架,为在高等教育学习研究中适当使用数据和技术的决策提供信息。[6]这种关注也激发了学习数据和技术的表达IMSGLOBAL赞助的学习分析实践社区的分析原则。[7]

我们正在努力解决一些难题。当学生与学校提供的数字环境交互时,谁拥有生成的数据?这些互动经常产生关于学生数字行为的上下文信息。元数据是为了响应数字学习环境中学生的交互而创建的。例如,时间戳可以与鼠标点击相关联,附加在记录的关于学生上一页的击键信息之后。这些数据是由学生交互产生的吗?

这听起来像是一针见血,但数据的所有权不仅带来了责任,而且还带来了决定如何使用数据的权利。正如Rayane Alamuddin及其同事在数字时代的学生数据,“在所有权和治理不明确的环境中,最突出的风险是有人会采取超越道德底线的行动。”

我们传统上表现为,当学生使用他们的校园学习管理系统时,大学拥有所收集的数据。学生如何表达他们数据的“所有权”?例如,在学生在实验室中完成的工作中,学生对其提交的实验室研究结果的所有权是他们的知识产权。[9]但是如果他们的数据有助于用于评估其表现的分析,或者在个性化学习途径中进行选择,学生对此应该知道些什么?关于数据的使用有哪些选择?

学生与教育机构之间的权力关系存在着强烈的不对称性。学生是否应该就收集、使用和处置他们通过学习互动产生的数据提供知情同意书?如果收集到的数据和应用到其中的分析是为了服务于他们的学习和发展,而不仅仅是为了使学校能够在最大限度地提高对学习者的投资回报方面发挥自己的兴趣,那么学习者应该对他们的数据有一定的理解和发言权。[10]

数据所有权的另一个方面是理解如何使用它。应用于学生数据的算法是什么?这些算法在做什么?学习分析和数据关键原则声明(图1)通过强调透明度. 这里的目标是提高学生留下的数据轨迹以及这些轨迹的使用、分析和影响方式的可见性。

10bet娱乐成代理进化论|方框1透明度
图1:IMS全球学习分析和关键数据原则

有理由担心吗?让我们看一个例子。在凯西·奥尼尔(Cathy O'Neal)的新书《数学毁灭的武器》的导言中,她讲述了五年级老师莎拉·怀索基(Sarah Wysocki)的故事,在华盛顿特区工作,那里只有一半的高中生毕业,只有8%的八年级学生在读小学一级的书。[11]一位新的校长被雇用来解决这些问题,并与一家咨询公司签约,开发一个名为IMPACT的教师评估工具,以识别好老师和坏老师,这样他们就可以摆脱这些问题坏的。Wysocki开了个好头,她的学生家长和导师对她评价很好。然而,她的影响力得分在倒数10%,结果,她被解雇了。

她的影响评分是基于一个算法,其中包括许多变量,其中没有一个共享或解释。她的学生,一个25岁左右的班级,住在华盛顿东南部一个贫穷的地区,同样面临着除了课程以外的各种各样的挑战。此外,该算法很少或没有训练数据来调整其精度。最后,她发现,作为衡量学生成绩的基准线的年终考试有很多涂改,这表明作弊是为了夸大分数。当该地区面对这一证据时,他们同意这是一些问题的暗示,但不是决定性的。维索基的射击被维持。奥尼尔解释说:“一个算法处理大量的统计数据,并得出一个概率,即某个人可能是一个糟糕的雇员,一个有风险的借款人,一个恐怖分子,或一个悲惨的老师。这种可能性被提炼成一个分数,它可以把一个人的生活颠倒过来。然而,当这个人反击时,“暗示性”的反补贴证据根本无法削减它。这个案子必须是铁证如山的。”[12]算法占了上风。

“算法偏差”的其他例子正在出现。麻省理工学院媒体实验室的研究员Joy Buolamwini描述了面部识别系统无法持续识别特定种族的人。这些系统中的代码来自可重用的代码库,开发人员经常使用这些代码库来节省时间。但他们展示了她所说的“编码凝视”,这种偏见嵌入到编码系统中,并由那些有能力编写算法的人传播

这两个例子,来自不同的领域,反映了算法的力量和潜在的危险,可能无意中,错误地,甚至有意出现。对学习分析透明度的呼吁是提高我们的关注度,确保偏见不会侵犯一个对我们学生的生活、成功和未来影响如此深远的企业。

仍有许多工作要做。关于学习分析的道德、所有权和实践的对话还很年轻。很可能仅仅宣称学生应该拥有他们的数据并不能使我们有足够的洞察力和理解来指导我们的行动。第一步是要求我们如何将算法应用于学生数据的透明度,以便学生及其家长了解这些算法的目的。但这也不够。我们必须扩大视野,以包括更广泛的背景,否则就有可能出现一个充满希望的未来。

– – – –

工具书类

[1] Phil Long和George Siemens(2011年),“穿透迷雾,学习和教育中的分析”,Educause Review,9-10月,pgs:31-40。

[2] 菲利普J。Goldstein&Richard N。Katz(2005),“学术分析:管理信息和技术在高等教育中的应用”,ECAR,研究8,113 pgs。

[3] UT Austin领导支持低收入学生的国家努力,UT新闻,最后访问日期:2017年2月15日:https://news.utexas.edu/2017/02/15/ut-austin-leading-efforts-to-support-lower-income-students

〔4〕俄亥俄州立大学“OSU文科学院向新生提供四年毕业保证”,新闻与研究通信02/21/2017;http://bit.ly/2lxwuFm

[5] Daniel Solove,“美国教育部首席隐私官Kathleen Styles访谈”LinkedIn:http://bit.ly/2lxoILD2013年4月17日

〔6〕Asilomar II:由斯坦福大学和伊萨卡S+R共同主办的数字时代的学生数据和记录,最后访问了2017年2月6日:https://sites.stanford.edu/asilomar/

[7] IMSGLOBAL,IMS全球学习数据与分析关键原则,最后访问日期:2017年2月6日,https://www.imsglobal.org/learning-data-analytics-key-principles

[8] Alamuddin,R.,Brown,J.,和Kurzweil,M(2016年9月6日)。数字时代的学生数据:当前实践概述. https://doi.org/10.18665/sr.283890

[9] 规则90101:知识产权,第6节:学生和知识产权。德克萨斯大学系统,最后访问:2017年3月6日http://bit.ly/2lxCZs2

[10] 斯莱德,S.和普林斯洛,P(2013),学习分析:道德问题和困境,美国行为科学家,57(10)1510–1529,DOI:10.1177/0002764213479366

[11] O'Neil,Cathy(2016年)。数学毁灭的武器:大数据如何增加不平等并威胁民主。纽约,皇冠/原型

[12]同上

[13] Joy Buolamwini(2017),“收入” — “开头”,最后访问日期:2017年3月10日,

https://medium.com/mit-media-lab/incoding-in-the-beginning-4e2a5c51a45d#.jlz2xt8wo

打印友好,PDF和电子邮件

为什么您的非传统部门需要优先考虑其系统

如何提供自助服务工具可以把非信贷部门从好到好

在这里阅读