Clients and Solutions

新闻排行

全民阅读”既然被写进国家战略做一个中国版 Lexile 阅读分级产品

2017-08-17 11:37

  考拉阅读曾在今年九月获得 400 万人民币轮融资,由 Pre-Angel 领投、线 月起将 Pre-A 轮。

  但和提分比起来,阅读并不是 K12 阶段的刚需,会有多少学校对阅读标准感兴趣?中国学生的真实阅读情况又是怎样的呢?有数据统计,中国中小学数量大约 41 万所,根据考拉阅读的前期调研,因为政策和一线语文老师的需求,大约有 30%-40% 的学校对阅读产品感兴趣,赵梓淳表示,即使能拿下这些学校,市场规模也很可观。

  蓝思的标准把读者的阅读能力分成了 1500 个等级,而这背后收集了几千本书的数据。考拉阅读的创始人兼 CEO 赵梓淳介绍,这些数据包括字频、词频和长难句,涉及语言学、认知语言学背后还有一套算法,需要不断加入各种语料进行完善。在这方面,考拉阅读根据权威小学的课外书单和专家,选取了部分图书进行标准构建。

  蓝思测评体系曾到美国国家卫生研究院的资助,主要从语义和句法两个维度衡量阅读难度系数,帮助读者选择适合自己的读物,目前产品覆盖了全美 50% 的学生。同时,很多教育科技公司在这个体系下诞生了,比如 36 氪曾经介绍过的LightsailCommonlit和 Newsela 等等。

  “孩子的阅读水平到什么程度?应该给他买什么样的书?”不光是在中国,这两个问题也困扰着其它很多国家的家长。但是在美国,这个问题有一个解决方案,就是通过对阅读内容和孩子阅读水平的评测,帮助他们找到符合自己阅读难度的图书,比较常见的测评系统之一就是蓝思分级阅读测评体系(The Lexile Framework for Reading)。

  建立自己的语料库,其中包括平衡语料库(学生日常能接触到各种阅读内容)和非平衡语料库(已经被专家评定过的内容,比如教材),通过机器分词将语料进行切割,从字频、词频、句式等不同层面建立初步标注的语料库;借鉴蓝思的数学模型,用机器学习的知识(比如神经网络)打造一个初步模型;在对初步模型测试的基础上,利用深度学习的算法,通过交叉学习挖掘难以被人为发现的学习特征;最后再根据学生主动做题产生的数据、以及阅读行为中产生的数据(比如阅读速度)不断对算法进行修正。

  整个过程有两个角色非常重要:专家和技术人员。赵梓淳介绍,在早期收集收据构建的过程中,考拉阅读和国内一些认知语言学、心理学学者建立了合作,他们更结合具体理论进行分析、给出细节性指导,同时还能帮助推动一些国家级课题;其次是技术人员,考拉阅读的 CTO 在大学主攻数据挖掘,曾在微软亚太研发集团、IBM 中国研发中心从事机器学习、数据挖掘方向的工作,技术团队都来自北大。

  赵梓淳表示,考拉阅读的 1.0 测评标准将在 1 月推出,这版产品将帮助学校划定图书难度系数,用数据帮助语文老师、校长看到学生的阅读效果。但是前期只能通过“线下看书、线上做测评”的方式推进,还无法检测到学生的读书数据,未来会考虑结合智能硬件的解决方案。

  而中国学生的阅读还是以纸质图书为主,因为家长对电子屏幕的顾虑,数字阅读在国内的推行相对困难。虽然没有每个学生每年在阅读上的具体花费,但赵梓淳给了这样一个数据,同样做中小学生线下阅读、线上做笔记和测评的攀登阅读今年以来实现了 4000 万营收。和攀登阅读一样,考拉阅读也只想定位于一个测评工具,让学生拿到测评结果后,在书库内找到合适自己的书线下阅读,而不是做类似 Kindle 的事情,所以版权问题暂时不会涉及。

  而在中国,大部分阅读测评都来自出版社,但是因为缺乏技术算法,而且测评和出版社的图书销售业务直接相关,测评结果都变成了“专家导向的阅读”,最常见的形式就是“适合 X 岁儿童阅读的读物”。不论是学生还是,科学地测评阅读能力始终没有实现。但是从 2006 年起,“全民阅读”的概念却开始一步步从国家层面推荐,最终变成一项国家战略。

  国外产品的商业模式主要以 to B 为主,赵梓淳表示,因为阅读的不确定性,要在中国推进阅读分级方向,也同样需要进校。在国家“全民阅读”政策的驱动下,很多学校都把阅读加入教学任务中,由语文老师以读后感、读书会的形式监督学生阅读。通过对学校的走访,考拉阅读发现这种方式让一些校长很无奈,因为阅读过程无法监测,读后感和读书会的“水分很大”。

  当阅读的重要性越来越多地被提及时,考拉阅读想探中国分级阅读,做“中国版蓝思”,给学校提供全方位的阅读解决方案。

Technical Support

网站统计