设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 98|回复: 1

自然语言处理(NLP)在教育领域中的应用

[复制链接]
发表于 2020-1-7 17:42:22 | 显示全部楼层 |阅读模式

在讨论AI的时候,第一反应其实是它跟教育是最契合的一个点,但大家好像提得比较少。语言是大家学习的对象,母语或外语都是对自然语言的研究。第二教师的授课、教材也都是自然语言。
NLP的教育应用分成三大类:
1)跟语言教学相关的应用。包括外语和母语教育(自动评分,辅导口语写作等)
2)教育文本处理。
一是教材的编订。举个例子,在所有剑桥官方出版的英语教材的封皮上面都有黄色的小标志,估计大家买书的时候直接忽略掉了,那上面写的是什么意思呢?它表示这本书用剑桥国际语料库通过语言学和自然语言处理的方法来检测书本里面内容的正确性和适用性,而且是在非常大的大数据、语料库上面完成的。 二是文本阅读分级,大家比较熟悉的是蓝思。 三是文本简化,生成题目。
3)对话系统,使用自然语言进行教学。让每个学生都能够有一个个人学习助理,有问题可以问它。但是目前来说这方面的应用,见到的系统比较少,因为在基础研究上面还是需要更大的进步才能让它有更好的应用。
下面看几个具体的应用:
NLP和教育结合的第一个应用是作文打分,这是成熟的应用。
ETS E-Rater用在托福、GMAT、GRE考试当中了。现在考托福,写作里面一部分分数是电脑自动评分的。ETS E-Rater和人工的打分数据非常接近了。
第二个应用是作文的纠错。
比如学生作文当中拼写、语法以及其他的各种错误,通过计算机看了之后可以给出相关的修改建议,包括润色,会建议学生更高级的表达、更符合的表达。原理是通过一个语言模型,用计算机阅读学生的作文,找出可能错的一些点,然后对这些点生成不同的建议,最后用模型根据用户不同的水平过虑和重新对建议进行排序,这是对于纠错方面基本的原理。作文纠错和作文打分,是NLP在教育当中的应用最成功也是最受人关注的两块。其他的应用包括简答题的评分,简答题的自动评分其实是只能针对于有固定答案的非开放性的简答题。
下面一个常见的应用是阅读分级。大家可能听说过蓝思(Lexile)阅读分级,这里面涉及到两个关键信息:词汇频率和平均句子长度。其实词的频度是词汇难度的表现,在大的语料库和文本当中,比如说所有的人民日报或其他报纸,如果一个词汇少见可能就是比较难的词。平均句长是语法复杂度的体现。大家觉得蓝思(Lexile)阅读分级的算法不难,但它的效果是非常好的,它可以给利用计算机给很多的文本、书籍进行自动处理、分析这些书籍的难度,然后对于不同水平的学习者给他们提供不同难度的学习资料。
另外一个应用是“词汇测试”,我是对于词汇自动生成选择题。给定一篇文章,计算机自动根据学习者的水平找到合适的句子,找到合适的词然后自动生成迷惑项,自动生成学生的练习题。这个好处是老师不需要提前对于阅读理解、阅读材料或者词汇掌握情况准备,只需要准备阅读材料就好了。原理和步骤:(1)找到学习者能够读懂的句子; (2)找到适合他水平的待测试的词; (3)生成迷惑项。迷惑项的生成很有讲究,迷惑项要足够迷惑才可以,它们在非常小的上下文里面都是可以讲得通的,但是放在整句当中正确的只有一个,最大化他的迷惑性,最大化测试的效果。

回复

使用道具 举报

发表于 2020-1-7 17:42:25 | 显示全部楼层
楼下的接上
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4 京公海网安备110108001289号  

GMT+8, 2020-1-21 05:51 , Processed in 0.300961 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表