首页 POWER4EDU TAB北京 | 朗播网创始人及CEO杜昶旭:利用大数据和AI构建语言学习新模式
TAB北京 | 朗播网创始人及CEO杜昶旭:利用大数据和AI构建语言学习新模式

TAB北京 | 朗播网创始人及CEO杜昶旭:利用大数据和AI构建语言学习新模式

  2017年7月28日-29日,由映魅咨询旗下POWER教育主办的TAB(Tech and Business)教育科技论坛在北京举行。朗播网创始人及CEO 杜昶旭从传统教育的班级场景和语培行业三大难题出发,探讨朗播网如何做教育行业的标准输出,并建立英语学习能力模型的逻辑,以朗播基于标准化产品模型的Inside系统为例,畅谈语言培训行业未来学习场景。

  杜昶旭毕业于清华大学计算机系,工学博士。2002年至2013年在中国最大的英语培训机构新东方工作,从事托福、GRE、SAT等出国考试类培训十余年,培训学员超过10万人次,是中国最著名的英语考试培训师之一。

  朗播网是一家基于自适应学习技术和行为大数据分析、以语言培训行业的标准输出为核心的互联网教育科技公司。朗播网致力于构建完善的在线英语学习生态环境,为英语学习者提供学习、备考、评测、练习、问答等一站式服务。公司成立于 2007 年 6 月,历经十年的产品研发和迭代,目前产品以出国留学考试(托福、雅思、GRE、GMAT、新SAT、ACT)和国内四六级考试为主。朗播网通过对有经验老师的访谈、采集,构建出人们的英语能力图谱。有了这套以英语能力图谱为基础的自适应测量系统,辅以学习动态计划生成引擎,朗播网便能够为学习者提供符合自身实际状况的英语学习体验,帮助用户以更短的时间带来更好的学习效果。


  以下是杜总的分享内容精选:

  杜昶旭:我今天想跟大家分享的是怎么看待大数据和AI对于语言学习的影响。因为我自己过去一直是做跟语言培训相关的工作,以前学的专业是计算机专业,所以基本上算是一个比较跨界的背景。朗播网做的时间比较长,从2007年到现在刚好十年,这十年我们做了很多工作,可能在行业里面的定位也不一样,包括我们自己对这个事情也有不一样的理解,希望今天跟大家做个分享。

  传统教育场景受物理空间限制导致班级的产生

  今天我们讨论一对一,一对多,大班课,小班课都是我们针对传统的培训行业提出的,不管是语培还是K12,因为只有在传统的教育里面才会出现班级的概念。为什么我们过去会有班级的概念存在?原因很简单,因为我们的教室只有那么大,过去所有的学习过程都发生在一个实体的教室空间里面,由于它的空间本身有限,就像我们今天组织这样一场活动,这个场地能坐多少人是有上限的。所以同样地,过去我们的教室只能坐这么多人,导致了分班的概念。后来对这个问题的讨论演变成:分不同的班级类型是不是因为跟老师的教学能力有关系?客观上讲,确实是和不同老师教学能力差异有一些关系。但是另外一方面,我们在新东方的时候,教过从几十个人到上千人的正常课程,你发现老师控制课堂的能力非常大,不管这间屋子坐一百人还是五百人,对我来说一点问题没有,我甚至能保证教学效果一点不比一对一差,甚至比它好很多。

  传统语培行业三大难题:品控无法解决、对师资依赖性大且易流失、规模经济性差

  在传统语培行业里面,有一件事情到今天为止都没有得到解决,叫品控。各位如果作为消费者,你们去选择任何一个培训机构的产品,不管做语培的,还是K12的,都会担心一件事情,今天去上课,这节课谁讲?张老师讲,还是王老师讲?把小孩送到幼儿园或者学校去,幼儿园的主班老师是谁,他的班主任是谁。考虑到这些之后,我们开始玩命的培训老师,但也在这个过程中开始产生了对师资事情的疑虑。是不是我们培养更多的老师就可以解决品控问题?实际情况好像解决得并不好。所以传统的培训行业面临的主要问题,第一个就是品控无法解决。所有人买商品的时候,都特别希望像我们买手机一样放心。只要不是残次品,同一品牌的手机,大家买的都是一样的。所以品控问题,是今天整个服务行业面临的巨大问题。

  第二个让所有的培训机构都会头疼一件事是老师流失的问题。一方面,机构会头疼老师本身的教学质量,另一方面,大家又有个纠结:如果使劲培养一个老师,效果出来了,但是他走了并在我家楼上开一间培训机构怎么办?或者好不容易招一个好苗子,使劲培养,结果旁边的同业机构挖走了,或者干脆谁也挖不走,我在你家对面挖一个。

  第三,规模经济性差也是巨大的问题。不管一对一还是一对多都存在这个问题,最典型的是表现在一对一上,因为一对一相当于一个人,而一个老师在单位时间内能服务的学生数是有限的。当机构规模急速上升的时候,授课老师数一定是上升,但是品控又没办法保证,导致口碑差,服务质量下滑,整个品牌价值就会降低。

  朗播网:做教育行业的标准输出,而非服务输出

  上面提到的问题都是我们过去在传统的培训行业所看到的一些典型问题。从我自己做朗播开始,就在想我们是不是能够通过技术的手段解决品控的问题,希望通过技术手段实现标准化。能否保证任何一个客户,在来到你的产品面前的时候,他们所得到的服务品质就像手机产品一样标准化,就像今天所有的客户来买我们的产品,不用担心今天的课谁讲。我们花了七八年的时间做基本的产品定位,我们觉得任何一个做学习产品的公司,不应该做服务输出,而应该做标准输出。大家可以发现所有的培训公司都是按照卖服务赚钱的,卖服务本质上等于卖时间。比如一个老师付出了多少授课时间,应该拿多少课时费。而从商业角度说,卖服务就脱离不了品控,因为你是靠人解决问题,必然解决不了品种的问题。但是如果我们今天卖的不是服务,而是一个标准化的产品,它就一定会解决品控的问题。大家买苹果手机的时候会发现苹果是有品控的,所以不用担心今天买的跟别人不一样,或者今天买的跟昨天买的不一样。但是销售人员服务态度就涉及到服务体验,如果手机怀了,拿到苹果手机的专卖店去做维修,你会发现每个人的水平不一样,技术能力不一样,会导致带来的服务也不同。反过来讲,我们是不是可以在语培行业也解决品控问题,或者能不能构建一个标准化的产品模型?

  朗播也在一直在探索是否可以非常准确的用一种量化的方式去解决语言学习的问题。有了这个可量化的标准化产品之后,才会往里面加AI或者大数据。具体怎么做呢?我给大家解释一下,如果我问给在座的各位“你的英语水平怎么样?”可能大家的回答基本上是“还行”,“一般”、“凑合”。我们再引导一下,“具体的听说读写能力哪个好,哪个不好?”大家的回答可能是“阅读还可以,口语差一点”。那如果进一步问,“阅读还可以”是可以到什么程度?“差一点”到底是差多少点?不同的人说都说“差一点”,能否衡量?这些问题如果问你,你是完全回答不出来的。但是如果今天大家登陆到朗播网去,测完以后就可以马上给你打分,像检验报告一样。

  建立英语学习能力模型实现用户学习过程管理

  我们可以定义一个能力的模型,描述一个人的语言状态。先测试你语言方面每一项的表现是什么样的,然后我们针对每一项表现告诉你接下来应该做什么。如果我们只看整个过程,相当于有一个系统能够帮助学习者解决现在的问题是什么,然后告诉他,这些问题的对应解决方案是什么,我们把这个东西叫做自适应学习。自适应学习就是有一个东西它了解学习者,它知道学习者现在的状态是什么样,并且根据体现在的状态,告诉他接下来应该干什么。所以本质上,人是最具有自适应学习能力的个体。换句话说,一个比较了解学生的老师,其实是可以看清学生现在的学习状况,并且指导他应该怎么学习。自适应系统就是要分析学习者为什么会把题目做错了,或者当初为什么把思考的角度弄错了,前面是测评要干的事,后面则需要有一套系统解决学习者的问题。在这个过程当中,需要解决的是标准化的产品模型问题。

  人工智能到底是什么?我觉得就是用机器模拟人思考的过程。现在的问题是,我们能不能让一台计算机像一个人一样,分析一个英文学习者的能力缺陷在哪里?这个问题很简单,比如说学习者把一道题做错了,需要先弄清楚到底是因为单词不清楚,还是问题看不懂,这需要评测。首先,如果我们定义了一套模型,这个模型有一堆规则,我们测这个人到底哪儿差。对测试学有了解的人应该知道,任何一个学科要测出学习者在某一个知识点上的学习水平,至少需要三道题。比如今天要测你在知识点和能力点的问题,说你现在的能力是什么水平,至少三道题。如果是200个知识点,就是600道题,做每道题都要有时间消耗。我们能不能用计算机模拟这个过程?这个时候要有所谓的神经网络,所谓的贝叶斯反馈,主要是关联信息的加速技术。我们可以建立一个模型,假设我有N个能力点,这里面肯定有一部分能力点和另外一些能力点之间会有关联。在标准化模型下,用人工智能的技术来实现所谓的计算加速。在能力测评系统里面,我们会用AI技术加速它的测评过程,让它的测评效率变得更高。

  第二个,在这样的标准化模型下,我们怎么实现用户学习过程的需求。我们去年有一个数据是关于达到同样目标的前提下,我们的学员平均学习时长。比如说考托福,传统的培训机构中,一个学生从培训前的六七十分的水平,到最后考120分。一般来说大概需要500到800个小时左右。但是我们看到去年到前年,朗播的这些产品整个时间大概控制在350至450小时的时间。整体时间消耗降低的原因就在于我们用技术的手段和标准化的模型,让学习者整个学习过程变得更精准了。传统的学习过程和在线学习过程有一个巨大的差异是什么?我们在传统的模式下,不可能采集到用户在过程中的行为数据的。我在上面讲,大家在下面听,每个人听成什么样,掌握多少我是不知道的。在线学习重要的一面在于过程是可以监控的。在过程当中,比如说学生犹豫了,这个犹豫可能表现在ABCD四个选项,他选了B,但是没有确认,又选了C,又选了B,最后确认了。这种数据,我们认为是有价值的。对于任何一个事情的平均时间损耗也是有价值的,比如这道题的平均损耗是一分钟,你可以是45秒,但是如果用了十分钟,那肯定是有问题的。在朗播网不仅要考虑本身的测评表现,还要考虑行为参数的影响。这个过程叫做行为大数据的采集。我们大概在过去接近一年的时间里面,采集了差不多一千万条用户数据,这些数据可以不断地优化引擎,让它变得越来越准。我们说基于大数据和AI的整个这套系统,其实最终满足的是真正意义上的个性化的学习诉求。大家一直谈个性化,一对一是个性化吗?我觉得不是的。只有在找到一个能分析你的人出现时,这才是个性化的过程,应该靠系统实现。我们在语言学习方面研究了十几年,发现过去传统培训,不管大班课,小班课,一对一,本质上都解决不了个性化的问题。虽然很多家长说我们需要个性化的服务,但是做的都不是个性化的服务。

  基于标准化产品模型的Inside计划带来规模经济

  在这种渴望个性化的学习环境下,有没有一些通用的东西是所有人都要掌握的?其实是有的,比如说方法论是所有人都要掌握的。我们今年6月份的时候发布一个产品,叫做基于标准化产品模型的Inside计划。英特尔把芯片植入电脑里面,为电脑带来了核心计算的部分。朗播有一套核心的解决方案,一直是2C端使用的,但是我们发现这个东西完全可以推给更多的人,无论是机构还是个人。过去大家发现培训产业很难标准化,也很难规模化,因为靠老师。但是有了这套东西以后,机构对老师的需求就完全不一样了。我不需要大量的老师提供服务,所有的诊断我自己都可以做了,只需要最靠谱的老师就可以了。比如说在朗播网学托福,这里面没有任何个性化的诉求在,所有的方法所有人都应该掌握,个性化的部分交给系统解决。

  Inside系统目前主要服务三类机构:留学机构、国际学校、个体助教

  我们把Inside系统开放给所有人,现在主要服务三类机构,帮助整个行业解决规模化的问题,以及包括品控问题。第一类是留学机构,它的学员最终要升学,要解决标准化考试的问题,如果机构自己解决不了的话,就要把学员推到语培机构。比如说新东方自己就有留学服务机构,如果中小的培训机构把学生转出去,可能就直接走到新东方了。有了Inside系统机构可以不用培养老师,因为我们全部帮他解决掉了。我用技术维度帮你解决你过去解决不了的问题,当机构植入了Inside,他愿意安排几位老师盯一盯,没问题,如果你不安排,我们的系统全部帮你解决掉。第二类是国际学校,目前我们也有很多国际学校的客户。国际学校的学生也有解决托福考试问题的需求,朗播可以帮你解决,而且可以保证品质。第三个更大的层面是个体助教群体。大家知道在培训行业里不是所有的人都有能力成为一个优秀的老师的。但是在市场上,大家可以发现大量的人作为助教存在,可以给学生讲清楚基本的语言知识和问题,但是不需要成为这个行业的专家。我们用Inside跟个体合作,我们招募了大量的个体助教,分布在全国各地,他们可以借助这个系统提供服务。我觉得大家听起来很像双师,但事实上告诉你,这跟双师有一个巨大的不同。在我们的系统里面,因为我有一套在中间跑,这套系统相当把所有的人全部连在一起,这个时候数据都是打通的。我们所有的助教在服务学生的时候,一定能看到学生的所有训练问题。所有的数据都是一样的,老师讲的东西是一致的,助教接受培训的是一致的,又变成完全标准化的。我们可以把服务撒到全国各地,核心的东西由我们来提供,我们相当于一个中央厨房,中间的系统不断地采集大数据,不断优化人工智能的体系,因为只有一套核心标准化的模型在那儿。

  理想的未来语言学习场景是学习需求可以随时随地得到满足

  我认为目前的在线语言学习还处于初级阶段,因为大家还在讨论班型是什么样,线上线下的融合是不是好的方式,我认为这不是行业成熟的表现。当一个行业成熟的时候,只有一个东西可以解释,就是需求。像今天的电商已经发展的很成熟了,大家不再讨论在线上还是线下买东西。在座的各位来说,你们买东西的时候,从来不会考虑我在哪儿下单,你只担心一件事,需求。当整个产业已经发展的非常完善的时候,它应该是以需求为核心的模式,而不是以形态。理论上来说,我们的学习需求未来应该可以随时随地的得到满足,可以在任何场景下完成。比如说我今天早上起来要学英语,不管是考试还是不考试。看到时间表上几点我有一个在线的直播课程,打开电脑就开始上,在家里就可以,拿个pad或者拿个手机,不管老师是在国内还是国外,中教还是外教。正好上的过程当中,朋友给我打电话了,我看时间也差不多了,我立刻挂掉电脑出门打车。我之前用电脑看的,现在关了电脑直接打开手机可以同步,打上车就走了,司机开车我就继续学。到了地方以后,我课已经上完了,不影响。我就跟朋友吃饭了,一点问题没有。回家的路上又收到一条消息,今天有什么作业要完成,这个作业根本不需要纸,完全可以用手机完成。但是我突然发现有一个问题,这个时候怎么办?一键call老师,像滴滴打车一样接单,马上视频对视频,解决这个问题。不着急的话,可以文字的方式。按照这个逻辑往下走,我发现我的任务表里面有一个东西叫做讨论,要讨论,做出来一个结果的。马上在线就可以实现,几个人在一个讨论组里面以视频的方式。进到一个虚拟教室里面讨论,讨论的时候可能有老师带领,至于助教在哪儿一点问题没有。也可以到线下去讨论,马上查一下,离你最近的能够提供讨论的老师在哪儿,可能离你家100米,就去了,讨论完了以后回家。

  我刚才描述的场景,大家千万不要认为这是科幻场景,我可以很负责的告诉大家,这个事情是真真实实可以实现的,而且不会超过三年。你说是融合教学吗?未必。我回到一开始提到的问题,请问班在哪里?所以班这个概念,没有意义存在了。上课的时候就是在一个虚拟教室里面,至于这个教室有多少人不重要。为什么我说这个事情不是科幻故事,今天朗播网做的事情,不说百分之百,但是80%已经做到了。这是我对未来学习场景的想法,而且我认为在未来的几年里面它一定可以实现,而且这里面有很重要的一点,就是所有的数据都是一体化的保存在一套体系里面流动,而且会随着你的学习过程一直不断地往前演进。第一个好处是让你个人学习行为变得更优,第二个好处是是让整个系统变得更优。像医疗一样,我们特别希望有一套终身医疗系统,管理我们的数据,学习也是一样,高考学过的东西,我们认为你已经掌握了,到了学托福的时候就已经不用学了。在上托福课学的,如果你回到国内以后,可能有些东西你也不需要学。

  在线教育在过去的几年时间里面真的非常火,虽然我们一直是比较低调的团队,业务发展的也还可以。但是我想说的是,无论是从用户的角度还是行业的角度,我认为我们可做的事情非常非常多。不管技术的角度,还是数据的角度,还是模式的角度,可能我们都在探索,希望有更多的人用更专业的角度看待这样的问题。当然,我们不需要把这些东西妖魔化。因为真正懂得人,是不会说得很悬的。