大模型,教培机构要过窄门
在AI大模型火爆起来之后,教培机构也加入了这场热潮,不少厂商、教培机构也推出了相应的教育大模型和落地成果。那么,如何看待教培机构做大模型这件事?一起来看看作者的分享和解读。
一度“元气大伤”的教培机构,也开始加入大模型的热潮了。
教育+大模型,并不稀奇,自从AI大模型火爆之后,教育就被认为是大语言模型最容易落地的领域。稀奇的是,和其他场内玩家相比,教培机构的优势确实称不上明显。
目前,市面上在做教育大模型的厂商,大概可以分为三类:一类是大模型厂商,如百度“文心一言”大模型被接入旗下品牌的学习手机,科大讯飞推出了星火大模型及学习机产品;第二类是教育科技公司,如网易有道打造了“子曰”大模型,作业帮自研了银河大模型,可汗学院、多邻国、Coursera、猿辅导等也都纷纷将产品与大模型结合,推出了AI助手型口语教练。
另一类,就是受“双减”影响的教培机构了,如新东方、好未来、学而思,也都披露了自家的大模型成果。
大模型在教培市场大有可为,与教培机构在大模型竞争中拔得头筹,这两个结论显然是不能划等号的。
毕竟三类玩家中,教培机构可能是离教育最近的一个,但也是离大模型最远的一个。技术、算力、资金、人才、互联网产品营销……教培机构都不可能比科技巨头、互联网企业玩的更溜。
那么,教培机构做大模型,是不是一场必输的游戏呢?我们认为不是。
正像《马太福音》中所说,“你们要进窄门。因为引到灭亡,那门是宽的,路是大的,进去的人也多;引到永生,那门是窄的,路是小的,找着的人也少”。
教培机构做大模型,应该换一个思考方向——钻入“场景”的窄门,走巨头大厂不愿意投入的“小路”,建立核心竞争力。
理解这件事,我们从教培机构究竟为什么要出发,开始说起。
一、原点,为什么出发
你可能会问,有钱、有技术、有实力的公司有壁垒,搞大模型顺理成章。开源大模型泛滥,普通公司搞大模型,简直就是往红海里跳,教培机构刚刚从“双减”阵痛中恢复了一点元气,怎么这么想不开?
说句公道话,教培机构做大模型,逻辑是能够自洽的。
第一个合理之处:大模型时代的教育,也需要教培。
有人说,大模型可以取代人类助教,智能导师比人类教师成本更低,这是确实存在的。但是,大模型仅仅是一个工具,并不能替代教师和教培机构的服务内容。
短期内,大模型还有很多技术难题没有解决,比如幻觉,大模型“一本正经地胡说八道”,输出的都是错误的信息,很可能培养出“学渣”;比如黑箱,大模型生成的内容可解释性不高,思考过程不清晰的话,答案的可信度不高,让AI“无人驾驶”来辅导孩子,学习效果不一定好。
长期来看,即使大模型进化到极高理解力、极高自动化程度、极低错误率,但教育产品和服务的本质还是学生,还是需要教培服务来更好地满足“千人千面”的具体需求。
正如同济大学校长、教授郑庆华所说,过去是老师和学生的二元结构。今天,机器在很多领域比老师干得还好。因此,未来的教学模式,可能会拓展为老师、机器、学生三元结构。所以,教培机构与AI结合,还是有很多的可能性的。
第二个合理之处:教育领域的大模型,精调少不了。
大模型自身的学习能力很强,GPT-4在SAT 等考试中都超过了88%以上的人类应试者。但就像高考状元不一定都是好老师,大模型学得好不代表一定能教得好。教育大模型,需要在通用大模型的基础上,加上自身数据进行精调,针对具体场景进行迭代优化,才可能(注意是可能)解决很多教育环节的具体问题。
举个例子,实际应用中,教育大模型非常重要的一点就是合规,用于教学、备课等场景的大模型,对语言组织能力、逻辑推理能力要求更高,且容错率低,一旦爆出不适当的内容就是教学事故,要提升大模型在此类任务中的安全可控,除了依靠高质量的标注数据,还需要专业教师的反馈、知识经验,而拥有大量教师人才和教学经验、数据的教培机构,显然是更具备行业优势。
第三个合理之处:短板不是真的短,长板却是真的长。
大家都学过田忌赛马的故事,在竞赛中获胜要用自己的长处去对付对手的短处。一眼看去,似乎教培机构在技术、人才、算力、资金等各方面,都比不上科技巨头或互联网公司,但有没有可能,这些短板在实际中,都不算是什么短板呢?
比如技术,教培机构确实在基础模型上的积累不多,但作为垂直行业,教培机构其实也没有必要全力投入自建底层模型,通过API云端调用、与头部厂商合作等方式,用相对较少的数据、算力资源和开发人员,就能建设出垂类的教育大模型。
多邻国的生成式AI应用,都是基于OpenAI的大模型来研发的,其报告中也强调,要做好功能而非做大模型,专注于应用场景。由此可见,教培机构如果不在基础模型赛道上跟科技巨头正面硬扛,那么所谓“短板”,其实对于做垂类大模型,影响并没有想象的大。
反而教培机构所拥有的数据、场景、行业know-how等“长板”,在大模型具体落地应用时,能发挥非常关键,甚至关乎生死的作用。
举个例子,教育和AI大模型,本质都是先苦后甜、漫长回报的慢生意,中间要经历很长的摸索、研发、客户积累的过程,习惯了“大水漫灌”、烧钱式增长的科技创业公司,反而可能因为太过激进、导致亏损,反倒是习惯了做慢生意的教培机构,有更多的耐心和教育大模型一同长跑,更有可能等到盈利的那一天。
所以,往深了看,教培机构做大模型的底层逻辑,其实是有其合理性的,也是有希望在激烈竞争中获得一席之地的。
二、终点,彼岸的风景
第二个问题,更贴近教学场景的教培机构,能给教育大模型带来哪些不一样的选择呢?区别于其它教育大模型的差异化竞争力,究竟在哪里?
这就要来说说,目前教育领域都在用大模型干什么。
软件层面,大模型+教育的新应用可以说是“乱花渐欲迷人眼”,不过可以统称为“AI助教”。就是让大语言模型来完成大量人类教师的重复性工作,比如撰写讲课大纲、口语陪练、作业助手、互动式讲题、课堂对话助手、知识点查询、智能评卷等,减轻家长和教师的辅导压力。
硬件层面,将上述软件能力集成到学习机、学生手表、学生手机、平板电脑等产品上,结合拍摄、OCR、姿态传感器等硬件能力,对终端算力、配置、交互等进行优化,比如要将大模型的规模压缩,以便在端侧部署。
目前来看,随着入局玩家的增多,无论是“AI老师”还是AI智能教育硬件,产品功能开始趋于同质化,逐渐呈现出白热化的竞争态势。这时候,教培机构做大模型,或许可以从既有优势中提取出一些差异化能力:
更专精。目前,“AI老师”的同质化功能,主要集中在一些容错率较高的场景,比如口语对话,开放式聊天对大模型的理解能力、逻辑能力等要求,是没有那么高的,而一些容错率较低的场景,比如数学解题、结构分析等,就比较难了。这恰好是教培机构的强项,通过精调、人工标注等方法,可以与同类产品拉开差距。我们注意到,学而思就重点研发MathGPT数学大模型,聚焦在数学领域的解题和讲题算法。单学科的精准辅导,可以成为教培机构做大模型的突破方向。
更个性。大模型好不好用,关键还是要看学生学的好不好。有一项1984年的研究发现,接受一对一辅导的学生表现,比接受传统课堂教学的学生高出两个标准差。
我们毫不怀疑,未来接受人类优秀老师辅导的学生表现,也会比接受AI老师教学的学生高。因为,学生在人类老师的注意和评价下,更有学习动力。所以,对于教培机构来说,未来可以用大模型来赋能线上课堂,给老师找个AI助教,让人类教师有更多的时间和精力,去深入了解和指导每一个学生,洞悉学生的兴趣,制定个性化的学习规划,这或许是让人类教师更有职业成就感,让学生学习效果更好的方式。通过人机协作,也能减少教育者在适应新工具时的抗拒心理。
其实说白了,教培机构以前在整个教育体系中所提供的差异化价值,有了大模型之后,依然没变,只不过用更高生产力的工具去实现。
三、两点之间,过窄门
说了这么多,感觉教培机构做大模型,好像是有理有据,既有前途又有钱途,是不是开足马力、全力投入,就能成功呢?
别忘了,在原点和终点之间,还有许多岔路口,而每一道都可能将教培机构引向歧途。
比如说,教培机构选基座模型,开源还是闭源?
很多人可能会说,当然是开源了,大厂开源的大模型性能高、成本近乎免费,fine-tune微调一下就能上线,简直不要太爽。可是问题来了,开源的free代表自由,也代表着开源人可以“不负责任”,毕竟又没找你收钱,后续出现了代码问题或者漏洞,没人维护就成了大麻烦。遇到新的勒索软件/病毒,开源人撒手不管,企业也没招。而且,开源的open并不是没有约束,是要有许可证的,如果开发者不愿意授权,或者滥用开源项目,很可能导致系统后续不可用。所以,用开源大模型来开发自己的垂类大模型,风险是客观存在的,一定要注意合规,防范失控的风险。
那有人可能会说,那我直接选闭源大模型作为基座,总没问题了吧?
值得注意的是,大厂的闭源的基座模型,能力上各有差异,很多排行榜所测试的能力,未必适配教育场景的需求。比如参数规模大的模型,性能表现比较好,但没办法部署到算力有限的端侧教育平板上,教培机构又不可能雇一个科学家团队来进行蒸馏、剪枝之类的压缩处理,是不可用的。所以,要找到最为理想的解决方案,需要教培机构有懂大模型的人才,开展专业的评测和选型。
此外,选择闭源大模型,给基础模型厂商付费,这也是一笔真金白银的开支,对于“元气大伤”的教培机构来说,也会带来一定的压力。
而且基础模型背靠大厂,在消费者和用户之间有较高的知名度,选择这类闭源模型确实可以很快说服消费者,快速做出购买决策,但也将自己与基础模型厂商捆绑在一起,一旦基础模型出现误差,就会影响消费者对品牌的观感。教育无小事,所以教培机构在选择闭源模型合作方时,也需要慎重考虑,最好是选择有“国家队”背书的大模型厂商,才是长久经营之道。
除了模型选型,在落地、迭代、营销等多个环节,教培机构要真正转型成为一个大模型能力的科技公司,需要补的课还比较多。
比如应用开发,教培机构要成为“产品经理”。教培机构直接调用基础模型API,可以短平快地打造出AI应用,但很容易陷入同质化竞争,无法发挥其优势,利润空间也会非常有限,而打造一款爆款AI原生应用,将大模型、AI跟业务结合起来,甄别用户的真伪需求,解决刚需问题,做到工程化的可用程度,需要深入到产品级思考。
几年前,俞敏洪在《在线教育到底有没有未来?》的一次发言中,说了一句话:是否有持续的接近刚需的需求,是判断一个教育公司的商业模式是否可以持续的关键。
大模型+教育刚刚开始,老师、家长、学生、学校、机构……都还在一点点探寻需求。其中哪些是恐惧错过的FOMO情绪驱动下的无效产物,哪些是真正的持续的刚需,或许只能交给时间。而在这个窗口期内,传统教培机构能否生长出AI产品能力,还是未知数。
总结一下,做大模型的路上会有无数岔路,是否有过窄门、走小路的勇气,能否做对选择,或许比技术本身更加重要。
无论是为了教育,还是为了生意,教培机构都需要新的故事,大模型是必然之选。
教育,将是大模型所孕育的无数新产业里,更早出发、更晚抵达的一个。对于教培机构来说,未尝不是一件好事,教育大模型的风口吹得更久、更长,留给教培机构的转型窗口和成功概率,也就更大一点。
作者:藏狐
来源公众号:脑极体(ID:unity007),从技术协同到产业革命,从智能密钥到已知尽头。
本文由人人都是产品经理合作媒体 @脑极体 授权发布,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
本身也在教育行业,也接触了一些AI相关的项目,有一个问题想请教——
大部分大模型在“逻辑推理”、“数学计算”上存在比较大的问题,这个是有大模型这个技术本身的一些底层逻辑决定的
这部分业内的哪些大模型一般是怎么解决的呢?