英语流利说如何用人工智能帮你说一口流利英语-极客公园

作者:colorvc

如果你正在或者曾经尝试过用手机 app 练习英语口语、纠正自己的发音,应该对英语流利说这个 app 不会感到陌生。

英语流利说成立于 2012 年,由 Google 前产品经理王翌和胡哲人、林晖在 2012 年 9 月共同创立。和不少在线教育的创业团队不同,英语流利说的三位创始人都没有传统教育培训行业的经验,反而各自都在计算机、人工智能等领域有很深厚的学术背景。

三个理工男要怎样把习得的技术变成大众喜欢的英语产品?王翌看到了当时市面上十分流行的产品——唱吧,如果把这种用户录音、平台打分的方式用到英语学习中,会不会提高学习者的积极性呢?

答案是肯定的。运用语音识别技术,英语流利说可以通过给用户的英语发音打分的方式,来增加学习的趣味,这种模式很受用户推崇。2013 年 2 月,新上线的英语流利说就幸运地被 App Store 在中国大陆,香港,台湾和日本作为新品推荐,并在当年入围了苹果官方的 App Store「2013 年度精选」app,这也是当年唯一入选的语言类 app。

在迅速积累了大量可以自发产生内容的用户后,英语流利说又顺理成章地建立了英语讨论交流社区。在一些热门话题中,有时会有数千条评论,逐渐成为了可能是全世界最活跃的语言学习社区。

60 万付费用户

完成了工具、社区的两级跳之后,英语流利说把下一步的目标放在高效率、个性化的英语学习这件事情上。

一年前,英语流利说上线了人工智能系统定制课程,这也是流利说推出的首个付费课程,因为它是一套系统性、定制化的英语提高课程。

在极客公园 Rebuild 2017 大会上,英语流利说 CTO 胡哲人分享了英语流利说和付费课程的详细数据。

胡哲人表示,经过了四年的发展,目前英语流利说的注册用户累计已经超过 4500 万,覆盖了全球 175 个国家。更重要的是,在不到一年的时间,英语流利说的付费产品已经累计获得了超过 60 万的付费用户。

在不断获得付费用户的同时,英语流利说的收入也一直保持着高速增长,在过去 12 个月时间里,每个月的收入增长率超过 30% 以上,这意味着英语流利说每个季度的收入基本都要比上个季度翻一番。

此外,胡哲人还表示,对这 60 万的付费用户进行进一步剖析后发现,其中有超过 80% 的用户

(接近 50 万用户)是第一次为英语学习进行付费。

和电商等行业不同,从市场份额上看,中国的教育行业并没有严格意义上的绝对巨头,即使是新东方和好未来(学而思是旗下品牌),他们加起来所占的市场份额都不到10%。换句话说,教育这个市场非常得细分,不同的人群对于教育所需要的产品诉求也非常不一样。「这 80% 就说明其实在过去很多很多语言学习的产品,都不能够满足用户的需求。而我们的产品,正好弥补了这样的缺失。」胡哲人表示。

在这些数据的背后,离不开的则是产品和技术的力量。

被技术变革的传统语言培训行业

「传统的语言培训教育行业里面最大的一个问题其实是人的问题,就是老师。其实,并不是每一个会说英文的人就可以当英文老师,就像在座的各位中文普通话我相信说的都非常流利,但各位并不能成为一个非常好的语文老师或中文老师。所以,老师其实是一个非常稀缺的资源,好的老师就更加稀缺了。」英语流利说 CTO 胡哲人表示。

对于要服务 60 万付费用户,如果对于一个传统的线下机构来说,他们的老师人数是不可想象的。即使过去几年非常火的像外教一对一的很多公司很多团队,他们老师的规模早就是 5 位数以上了,基本都是 1-2 万人。

对于以新东方为代表的传统线下培训机构来说,在参加培训的学生数量增加的情况下,只能不断通过招聘、培训等方式扩大老师的人数,不少培训机构的老师规模已经达到了 5 位数。

在人力成本不断上升的背景下,这意味着参加传统线下培训机构的培训,通常成本会非常高。特别是在很多大城市,一期语言培训的成本经常要达到上万甚至几万元,如果你想获得「一对一外教」等这样的「高级」服务,价格还会进一步提高。

相比之下,英语流利说这种基于技术打造的互联网产品,严格来说,

其背后只有一个老师。

「不过这个老师是具备人工智能能力,面对每一个学员的时候,又能够做出非常个性化的内容、规划,给用户非常个性化的体验。所以对每个人来说,也是一个不一样的老师。」胡哲人说。

英语流利基于人工智能老师的系统课程自然也有着天生的优势,一年 966 元价格还不到大部分线下培训机构一期课程的零头。

除了成本上的优势,移动互联网的天然属性让英语流利说的学习形式可以跨越物理空间和场地的限制,辐射到更大范围的人群。

胡哲人表示,「在我们的 60 万付费用户里面,的确有非常多的来自美国、澳洲、英国、东南亚的一些学员,我相信可能是当地的一些新移民,他们也要提高自己的英语融入当地社会。在这个时代,基本上你只要足不出户,拿着手机,就可以选择到最合适自己的内容,同时选择到最好的老师。」

100 小时 VS 36.5 小时

价格便宜,不受物理空间限制,这是移动互联网为英语流利说赋予的优势,也是相比传统的线下培训机构的核心竞争力。

不过在抛开了价格和空间之后,英语流利说这个「人工智能老师」的效果究竟如何呢?它能否媲美传统的线下培训机构?

「按照业界著名的欧标(Common European Framework of Reference for Languages;CEFR),对于一个母语非英语的人,要提升他的语言能力到能够自由交流,大概需要 1000 个小时,然后又分为了 6 个等级,每个等级的提升至少需要 100 小时。」

英语流利说 CTO 胡哲人表示,「之前,我们花了点时间和一个公允的第三方做了一个合作,把我们学习人工智能的学生也拿去做了一个测试,就发现这些学员提高一个欧标等级差不多平均学习 36.5 个小时。

所以大家可以看到,其实我们是能够帮大家节省差不多 2/3 的时间。」

用内容、数据、技术打造未来教育形态

在去年 10 月的云栖大会上,阿里巴巴集团创始人马云提出了「五新」的概念,即新零售、新制造、新金融、新技术、新能源。在今年的极客公园 Rebuild 大会上,英语流利说 CTO 胡哲人在「五新」的基础上又补充了一点:新教育。

胡哲人认为,「新教育也是基于大数据和各种技术,能够极大的再造在传统教育行业中一些生产元素、生产工具、生产关系,推动这个教育改革到一个新的形态。」

在新教育中,有三个最重要的基石:内容、数据和技术。

大概在两年前,英语流利说开始设计系统课程。不过试图从一些著名出版社引进系统化内容的过程中,英语流利说的团队发现,这些已有的内容并不太适用。「我们很失望的发现,这些内容都很陈旧,而且即使有些内容是数字化的,也适合在 PC 机这样一个终端上去呈现,很难去满足在移动端,在碎片化的时间上学习。」胡哲人说。

最后,英语流利说找到了 Lance Knowles 先生。

Lance Knowles 先生

Lance Knowles 先生曾担任美国戴耐德国际有限公司总裁,被誉为「RHR 层级递归认知理论之父」,是全球多媒体英语教学领域最具经验的先行者和领导者,所研发的课程获得了包括不同国家教育部认证在内的 40 多个奖项。

更重要的是,经过评估之后,英语流利说认为,Lance Knowles 先生的 RHR 理论可以和其产品及技术有很好的融合。因此,英语流利说决定做出一套完全基于移动的碎片化的系统课程。

当把所有的学习内容数字化之后,收集到非常多的数据就是一件自然而然的事了。

胡哲人表示,「语言学习最突出的一个数据就是语音数据,在流利说这边,每个用户说的每一段话,做的每段配音,其实都在点点滴滴的为我们累计一个全世界最大的中国人说英语的语料库。这个语料库现在差不多已经有 6.1 亿分钟了。除了语音数据以外,其实视频数据也在被大量的采集,因为教学的过程,老师的教、学生的学,已经有很多人应用移动设备,包括在教室里面放一些视频录制设备,去整个收集这些语音数据然后进行分析。」

利用英语流利说收集到的目前最大的中国人说英语的数据库,英语流利说打造了一个可能是全世界强大的识别中式英语的识别引擎。CTO 胡哲人自信地表示,「和 Nuance、Google、科大讯飞等前辈相比,我们在这个领域比他们做得都要更好。」

在 2017 年,几乎所有互联网公司都在提深度学习和人工智能,但在这背后,大量有价值的数据才是真正的基础和价值所在。只有当有了足够多的数据,才可以去谈人工智能技术,打造「人工智能老师」。

在在线教育中,自适应教育是一个经常被反复提到的词汇,因为自适应技术其实代表老师大脑的一部分。因为只有自适应技术,才能够真正地给学生提供个性化的内容,给学生规划最个性化的学习路径,让学生获得个性化的学习体验。

不过这里有一个问题,传统的自适应技术是基于很多的专家系统,需要依靠人力来做知识库、知识梳理、知识图谱、打标签等等,非常繁琐并且耗时,不少自适应项目也因为这些原因很难落地。

在这个方面,英语流利说选择了一个不一样的方法。胡哲人在演讲中提到,「我们现在人工智能课程背后的自适应技术完全剖析了专家系统,包括知识图谱、知识打标签,完全是通过对于现有的内容和 60 多万用户学习的数据,自动地学习数据,自动不断地迭代、进化,产生的自学引擎。所以在这点上我们还是做出了非常不一样的东西。」

「综上,内容、数据、技术,这三样东西才是真正能够一起来打造未来的一个教育形态。而且我们相信,在未来教育形态里面其实是离不开人工智能这个东西的,因为只有人工智能介入,才能够真的再造传统教育环节里面非常多的传统生产元素、生产工具和生产关系。」

做语言教育领域的特快专列

在当今时代,有非常多的行业已经开始帮用户节省的时间越多,给用户的价值越大,收取的费用也越高。最显然的就是快递和出行行业,比如当天件比隔夜件贵,机票比火车票贵,火车票比汽车票贵。

不过在传统的语言培训和教育行业,由于成本构成等原因,始终存在一个现象:你在我这里学得越慢、长进越慢、浪费的时间越多,我收取的费用反而越高。

在移动互联网以及大数据、人工智能等技术的驱动下,以英语流利说为代表的在线教育理论上是可以做到按效果付费,从而帮助用户节省时间。

演讲最后,英语流利说 CTO 胡哲人抛出了一个问题:

「当我们在语言培训、语言学习的领域达到这样一个以结果为导向,非常追求效率的情况的时候,我们怎么看待 K12(编者注:K12 指的是从幼儿园到 12 年级的教育,国际上用作对基础教育阶段的通称)这个领域呢?大家从幼儿园开始到进入大学,当中要经过长达 12 年的时间。如果说我们对于这 12 年中间的学习,也能够更加以结果为导向,更加追求效率的话,我们是否能够在未来把 K12 变成 K6 呢?」

相信在不远的未来,这个问题将会被越来越多的人提及和讨论。

acad2018