纽约时间2016年11月13日下午4时,北京时间14日凌晨5时,纽约大学Courant研究院CILVR Lab实验室与享阅教育正式宣布成立中文分级阅读及中文NLP研究联合实验室。
纽约大学Courant研究院是全美最著名的数学研究院,其下属的The CILVR Lab (Computational Intelligence, Learning, Vision, and Robotics)则是国际上最为享有盛誉的人工智能及机器学习实验室之一。而北京享阅教育科技有限公司则是一家扎根于中国教育土壤的科技创业公司,始终致力于通过机器学习与数据挖掘等新技术,打造完善的中文分级阅读标准和自适应阅读平台,进而彻底改变中文学习者的阅读现状。此次联合实验室的成立,意味着更多国际最前沿的机器学习的研究成果将适用于中文语言处理的领域,以帮助中文分级阅读标准的建立,此外,双方的合作方向还将覆盖中文NLP研究和阅读数据挖掘在内的多个细分领域。
联合实验室的CILVR Lab实验室方面负责人Jake ZHAO博士作为深度学习领域的专家,具备多年自然语言处理和计算机视觉研究经验,师从机器学习顶尖学者、深度学习奠基人之一的Yann LeCun教授。LeCun是纽约大学终身教授,同时也是Facebook人工智能实验室的负责人。为了表彰他在深度学习领域里的成就,IEEE计算机学会曾为其颁发著名的“神经网络先锋奖”。此次联合实验室的成立,也得到了LeCun教授的支持与肯定。
赵博士表示,在美国,超过95%以上的学校在使用分级阅读的相关产品来收集和分析学生的阅读数据。基于分级阅读标准记录的阅读能力评价是除去数学、英语成绩外最重要的学习评价指标。借助分级阅读系统,美国学童从小就用科学的方式涉猎历史、地理、人文、科学,新闻。而中国因为缺乏科学的中文分级标准,阅读能力难以量化,孩子的阅读兴趣低下、结构不均、成长性差,以致中国儿童的阅读量只有美国的六分之一左右。在过去囿于技术的原因,很多基础性的研究难以开展,但最近几年深度学习的方法兴起,极大推动了NLP领域的研究进程。深度学习带来的变化主要是特征的定义与抽取。无论是基于单字,还是基于词,最近几年都已经进行了不少这方面的研究尝试。
赵博士进一步指出,NLP中文本是非结构化的数据表示,需要通过特征提取,抽取关键信息以用于机器学习模型的分析处理。因为其特征的复杂性与非线性,在未来deep learning技术有着很广阔的发展空间。最近十多年,机器学习的发展非常迅速,新的模型,新的算法层出不穷。中文分词由于其重要性,以及问题的清晰性,成为很多新研究的试验场。在未来,将与享阅教育首先在中文的NLP研究上进行深度的合作,并且在此基础之上,共同运用Deep Learning方式来打造中文分级标准的黑盒模型。
人工智能正在迎来新的产业爆发期, 2018年全球人工智能市场近470亿美金,年复合增长率55.1%。在可预期的未来,下一波教育创业浪潮的核心驱动也一定是来自以人工智能为核心的“科技+教研创新”的融合。
2016年,享阅教育与国内顶尖的认知语言学学者团队合作研发完成了第一个拥有完整自主知识产权、以高级算法为核心并具有深厚语言学根基的中文分级阅读标准,同时,享阅教育主持了国内第一个有关中文分级阅读量化标准有效性的实证研究项目。据悉,享阅教育的技术与教研核心团队均来自于北京大学,CEO与CPO则毕业于常春藤名校,此次与世界顶尖机器学习实验室的合作,势必将进一步夯实其在中文分级阅读和自适应学习领域的领先地位。