教育新闻_为您服务教育网
推荐:古诗欣赏 2016中考 2016高考 阅读:
  您当前位置:为您服务教育网首页>>> 教师中心>>>教育新闻 >>机器批作文:有效防背作文和套作文
机器批作文:有效防背作文和套作文



         澎湃新闻

  在高考评分中,作文往往是最耗费工作量,也最具争议的一项。近年来,由于高考作文评价体系屡遭质疑,相关领域的专家学者开始思考运用机器评分,来取代准确度不高且耗时耗力的人工批改。11月26日,华东师范大学(分数线,专业设置)中文系副教授徐默凡,在华东师范大学一场有关“应试作文写作质量的计量和计算”的研讨会上,就机器在作文评分中的实现可能性进行了探讨,并对当下的应试作文评分进行了反思。

  通过数据统计可找出背题套题的作文

  据徐默凡介绍,目前有望运用于机器评分的自然语言处理模型有三类,分别是基于规则识别、数据统计和神经网络的自然语言处理。

  所谓基于规则识别的自然语言处理,是基于一定的规则对作文进行句法分析和语义分析,从而掌握对语言的理解和表达。徐默凡认为,这条路对于作文机器评分是走不通的。因为首先,人类自身并未建构起准确的作文评分标准;其次,作文评价标准涉及到的因素比句子理解更多,思想、逻辑、结构、语言等要素难以规则化。

  第二种模型则是基于神经网络的自然语言处理。它的原理在于运用脑科学和仿生学,模仿人脑对信息的处理方式。然而在徐默凡看来,这种模型也不适合用于机器评分。除了训练复杂度高,费时费力之外,无法对它的信息处理过程进行探测和评估,因而结果的可解释性差。

  更重要的是,这种模型牵涉到了关键的智能伦理问题。AlphaGo的横空出世令人惊诧,而相比围棋,作文更是人类智能的体现。如果将作文评分交给人工智能,很容易引起伦理上的反感甚至恐慌。高考这一事关很多人前途的重大考试,若完全交由人工智能去判断评分,很有可能会造成“机器将会主宰人类社会”的联想。

  于是相比之下,基于数据统计的自然语言处理才是更适合机器评分的模型。这种数据统计的基本原理是,一个句子是否合理,不必了解它的句法语义,只需要考察它在人类说过的话中出现的可能性大小如何:出现的可能性越大,即越合理;可能性越小,则越不合理。理论上,进行这种自然语言处理时,需要把人类讲过的所有话都统计一遍;然而在现实中,进行词频统计就已绰绰有余。“词频统计现在已经是比较成熟的研究成果了,”徐默凡说,“在实际中,也可以考虑到前后文的关联和影响。只是考虑的词越多,意味着计算也会越复杂。”

  徐默凡指出,数据统计可以有效禁止背作文和套作文的行为。如今中高考已成为了背作文和套作文的重灾区,同一个教师教出的学生背诵了一样的范文,因而考试时写出相似的作文,这一普遍现象若依靠人工力量是很难被察觉的。这里就是机器大显身手的地方了。它可以通过统计给出重复率百分比,并自动摘要出不同考生所写的相同事例,再由人工鉴定是否是作弊。

  此外,作文的语言规范度也可以使用统计测量。通过计算每篇作文的概率值,概率值越高说明语言用法越常规,以此就可以识别不规范的语言用法。“当然,概率低也有一种可能,那就是作文在语言上进行了创新,使用了一些新颖的表达。在此使用统计法,至少可以挑出概率低的表达,进而进行人工筛查,重点关注,再根据不同类型的作文要求赋分。”徐默凡说。

  在高考评分中,作文往往是最耗费工作量,也最具争议的一项。近年来,由于高考作文评价体系屡遭质疑,相关领域的专家学者开始思考运用机器评分,来取代准确度不高且耗时耗力的人工批改。11月26日,华东师范大学(分数线,专业设置)中文系副教授徐默凡,在华东师范大学一场有关“应试作文写作质量的计量和计算”的研讨会上,就机器在作文评分中的实现可能性进行了探讨,并对当下的应试作文评分进行了反思。

  通过数据统计可找出背题套题的作文

  据徐默凡介绍,目前有望运用于机器评分的自然语言处理模型有三类,分别是基于规则识别、数据统计和神经网络的自然语言处理。

  所谓基于规则识别的自然语言处理,是基于一定的规则对作文进行句法分析和语义分析,从而掌握对语言的理解和表达。徐默凡认为,这条路对于作文机器评分是走不通的。因为首先,人类自身并未建构起准确的作文评分标准;其次,作文评价标准涉及到的因素比句子理解更多,思想、逻辑、结构、语言等要素难以规则化。

  第二种模型则是基于神经网络的自然语言处理。它的原理在于运用脑科学和仿生学,模仿人脑对信息的处理方式。然而在徐默凡看来,这种模型也不适合用于机器评分。除了训练复杂度高,费时费力之外,无法对它的信息处理过程进行探测和评估,因而结果的可解释性差。

  更重要的是,这种模型牵涉到了关键的智能伦理问题。AlphaGo的横空出世令人惊诧,而相比围棋,作文更是人类智能的体现。如果将作文评分交给人工智能,很容易引起伦理上的反感甚至恐慌。高考这一事关很多人前途的重大考试,若完全交由人工智能去判断评分,很有可能会造成“机器将会主宰人类社会”的联想。

  于是相比之下,基于数据统计的自然语言处理才是更适合机器评分的模型。这种数据统计的基本原理是,一个句子是否合理,不必了解它的句法语义,只需要考察它在人类说过的话中出现的可能性大小如何:出现的可能性越大,即越合理;可能性越小,则越不合理。理论上,进行这种自然语言处理时,需要把人类讲过的所有话都统计一遍;然而在现实中,进行词频统计就已绰绰有余。“词频统计现在已经是比较成熟的研究成果了,”徐默凡说,“在实际中,也可以考虑到前后文的关联和影响。只是考虑的词越多,意味着计算也会越复杂。”

  徐默凡指出,数据统计可以有效禁止背作文和套作文的行为。如今中高考已成为了背作文和套作文的重灾区,同一个教师教出的学生背诵了一样的范文,因而考试时写出相似的作文,这一普遍现象若依靠人工力量是很难被察觉的。这里就是机器大显身手的地方了。它可以通过统计给出重复率百分比,并自动摘要出不同考生所写的相同事例,再由人工鉴定是否是作弊。

  此外,作文的语言规范度也可以使用统计测量。通过计算每篇作文的概率值,概率值越高说明语言用法越常规,以此就可以识别不规范的语言用法。“当然,概率低也有一种可能,那就是作文在语言上进行了创新,使用了一些新颖的表达。在此使用统计法,至少可以挑出概率低的表达,进而进行人工筛查,重点关注,再根据不同类型的作文要求赋分。”徐默凡说。


 分享到:分享到QQ空间QQ空间 分享到新浪微博新浪微博 分享到百度i贴吧百度i贴吧 分享到开心网开心网 分享到人人网人人网 豆瓣网 我的收藏
       
       
   上一条: 没有记录
   下一条: 控作业总量能否减学生课业负担?
本栏目最新14条记录:
 · 机器批作文:有效防背作文和套作文 · 控作业总量能否减学生课业负担?
 · 10岁男孩痴迷手游败光母亲治病钱 · 评中学当面砸毁学生手机
 · 10岁男孩手机导航独自去湖南与家人团圆 · 假期不出游 家长忙着给孩子“充电”
 · 校园伤害学校担责 体育课因此被减 · 河南体罚学生涉事老师被调离教学岗位
 · 高中生们有点“嫌弃”老教师太传统 · 成都一中学:学生犯错要扣钱
 · 山东济阳17岁高二学生离校出走 · 河南培养村小全科教师:能教11科
 · 陕西佳县一小学校长用圆珠笔扎伤学生 · 12岁女儿写信控诉妈妈爱玩手机
 -> 祝您健康 最新推荐


推荐阅读
   家庭教育+幼儿教育+赏识教育
    为您服务教育网今日推荐

联系我们 本站搜索 要资料 请您留言 开心智慧吧 动画 笑话 安平影像 周恩来总理
为您服务教育网——全心全意为中国教育免费服务(Copyright© 2001-2017 河北·衡水) 安平明德小学 一小学前三班
冀ICP备06009845号