logo
亲近母语

首页 > 首页资讯

亲近母语持续研究中文分级阅读,打造中文分级阅读产品体系

作者:  发表时间:2020-04-16 15:11:07

分级阅读在国外已经很成熟,有一整套英文分级阅读标准系统,不仅运行了将近40年且已覆盖了美国90%的学校,如Lexile分级(蓝思分级)、GE分级等。而在国内,中文阅读不仅连分级标准都未建立,很多教师甚至连分级阅读都没听过,教师、家长对孩子的阅读水平的了解也一直处于空白状态,因为获取这一数据的渠道不是没有,就是非常非常有限。

在欧美,英文的分级阅读主要有两个维度:

语义:主要看词频,如果一个单词出现的频次很低,则系统会判定这个词相对较难。

句法:主要看句子长度,长句一般较难去分析和理解。而句子难度跟从句、副词、介词等的使用也密切相关。

在这两个维度上,欧美国家通过统计学的方法来完成分级阅读标准的建立。中文分级阅读标准(ER Framework)借鉴了国外的“词、句”的分析思想,因而和其有一定的相似性。

中文和英文的三大本质区别主要在于:

基础单元:英文的基础是26个字母,中文的常用汉字达3500个,这就决定了中文阅读的分析必然需要一个规模化的语料库。

分词:英文不需要分词,仅需空格即可判定词语的边界,但汉字脱离不了分词。如「量子自旋效应」这个词,有人可以将其分为「量子」、「自旋」、「效应」三个词,也有人认为这就是一个词。但在英文中就无此类困扰。

句式结构:在句式结构上,英文要严谨得多,如主从句之间会有that、which、what等来界定。中文的行文风格则较为随意,嵌套结构也要混乱得多。

鉴于这三大区别,基于ER Framework的分级阅读标准从「字词句段篇」五大维度提取几十个特征来表达中文的难度,并实现段落、主题等的分析。如在「字」其下还有常用性、构形、组合性三个特征,「句」则有句法结构、语义逻辑、修辞表达和嵌套深度四个特征等等。

“因为中文的的句子相较英文要复杂得多,机器在理解中文的第一步就会遇到词性分析、语言模型上的困难。所以,有赖于现在流行的AI技术,如RNN、LSTM等深度学习技术,可以弥补中文在NLP上的缺失。”

“现在我们可以做到,将一个句子按照句法树、依赖关联等予以拆解,以分析每一个成分在句子中的比重,从而实现阅读文本的难度分级。”

区别于欧美英文分级阅读,亲近母语的分级阅读系统最大的优势亲近母语持续专注的研究。随着用户数量的增加,产生的数据越多,分级阅读系统中的模型可实现自主学习,不断优化,从而对文本阅读的难度感知越发准确。

  • 基于ER Framework的个性化分级阅读系统;
  • 基于ER Framework和“新课标”的阅读能力测评;
  • 针对公立学校的阅读整体解决方案,包括教师培训、整本书解决方案、分级短文材料,分级阅读测试等。

国内很多中小学都很重视学生的测评,但在阅读能力的测评上却处于相对空白的状态。亲近母语在线上和线下:在国内的一线到四线城市,对近10万学生进行了基于ER Framework和“新课标”的阅读能力测试,并对相关数据进行分析,最终出具了一份中国学生的阅读能力量表。在测评的助攻下,亲近母语成功打通了和中小学合作的路径。

「教师」这一角色反而是整个推进过程的关键角色。因为虽然已经开发出中文分级阅读标准及其配套工具和产品,但这些工具和产品依然需要人来使用,需要教育者来向这些孩子传递教育的温度和理念。但是,国内教育理念跟不上,语文教师对整个前沿教育的趋势掌握不到位......这些都是问题。

分级阅读进入国内的这些年,不是没有遭受过质疑之声,有人认为分级阅读不适应中国国情,比如有些孩子从小耳濡目染四大名著,可能会对超出分级阅读系统推荐的书目以外的书籍感兴趣,当然不能排除这种可能性。

分级阅读系统只是一种工具,它并不能喧宾夺主说可以取代老师。做分级阅读的意义就在于,想告诉家长和老师,哪种文本难度的书目是适合你的孩子或学生去阅读的。至于读还是不读,依然需要家长和老师去做出判断。

当前文章标签: