AI会改变教育,但教育不会只有AI | MonoX

Monolith砺思资本·2025年9月1日

学习的瓶颈已经不在知识本身,而在于意愿和专注力时间

当前,在AI应用浪潮中,教育领域是众多创业者积极探索的赛道之一。

AI正为教育场景拓展出新的可能:从智能助教、个性化学习路径推荐,到自动内容生成和多模态互动教学。然而,这条赛道并非坦途,实际落地过程中存在一系列关卡,如技术性能瓶颈、用户认可度障碍、商业模式困境等,都有待从业者逐一破解。

近日,MonoX系列沙龙举办了主题为「AI如何改变教育产业」的线下活动,来自教育领域的数十位嘉宾齐聚现场,共同探讨AI+教育的落地之路。

在活动中,嘉宾们围绕以下话题展开了讨论:

· AI落地教育场景的工程瓶颈与解法

· 用户学习需求的迁移与参与感的提升

· 教育新模式的实践探索与观察

· AI+教育的商业化困境与现实挑战

· 面向未来的技术演进与产业生态预判

我们整理了本次讨论的核心内容,希望对从业者们有所帮助。

目录:

  1. 工程瓶颈与解法

  2. 用户需求的迁移

  3. 教育新模式的实验与观察

  4. 商业化困境与现实挑战

  5. 面向未来的技术与生态

  6. 巨头下场,AI教育创业的未来在哪儿?

1. 工程瓶颈与解法

1.1 不止Chatbot:多模态与性能难题

AI赋能教育首先要跨过技术门槛。许多早期尝试集中在对话式AI老师,但真实教学场景远不止聊天问答,还涉及视觉、语音等多模态交互。例如,拍照搜题和作业批改是常见需求,但目前大部分教育终端设备(如学生平板)算力有限,难以在本地实时完成试题的识别和框选。

对此,业界的实用解法是将计算转移到云端:**利用更强大的服务器运行先进的模型(比如YOLOv8),并通过图像增强校正提高识别准确率。**同时,由于国内教材和练习册版式复杂多样,手写答案的OCR识别也有挑战——通用API在公式、中英混杂的场景下准确率仅有约65%~70%。例如下图是人教版初中数学教材的一页截图,在版式多样、存在大量符号与图形的情况下,OCR识别已存在困难,如果再加以手写答案,识别难度将会更高。

国内教材和练习册的复杂版式

为提升效果,自研模型也是一条可行的道路,有团队基于新版目标检测模型(如YOLOv10)来准确定位题目区域,并结合视觉Transformer模型(ViT)等多模态算法对题目类型进行分类,提高了识别的精确度。

1.2 语音交互:ASR与TTS定制

在口语练习和对话教学中,语音识别(ASR)和语音合成(TTS)的技术细节也直接影响产品体验。

一个比较突出的问题是儿童用户的语音识别:学生回答通常语句短且伴有口音、环境噪音,例如一个学生在家里嘈杂的环境中回答一个简单的"不"时,直接调用现有模型的API往往效果不佳。

一些创业团队针对这一场景自行训练了类Whisper模型,并结合说话人识别、降噪和文本纠错等模块,将识别准确率提升到了96.5%。而在语音合成方面,AI给教材配音时遇到的难点在于正确朗读公式、音标、拼音等特殊内容,这需要模型深度定制;有团队采用多Token预测等技术来加快合成速度并提升对特殊符号的念读效果。

1.3 Agent:教学策略训练

今年AI领域大热的Agent在教育中的落地也备受期待。那么,一个真正好用的教育Agent需要具备什么?

共识是:**它应当像真人老师一样,不仅能对答,还能调用课件、查阅过往学习数据,甚至临场手绘图示讲解难点。**这意味着Agent需要学习教学策略,而训练这种策略的有效途径是利用高质量的一对一真人辅导教学数据,对Agent进行有针对性的训练。不少团队已经在积累此类数据,希望让AI教师的行为方式更贴近优秀人类教师。

总的来看,目前AI+教育在工程上采取的是多管齐下的务实路线:针对不同模态和环节的瓶颈,各自寻求优化突破,而不是依赖一个通用大模型解决一切。这包括端侧算力不足就云端补齐,自研细分模型弥补通用模型盲区,专门打造符合教学场景的AI智能体等等,努力将技术瓶颈逐一击破。

2. 用户需求的迁移

随着技术逐渐成熟,教育产品的竞争重心正在转变。一个在本次讨论中比较鲜明的观点是——AI时代教育的核心不再是知识的传递,而是学习的参与感。

具体而言,当AI能够完成大量知识型工作后,纯粹灌输知识的价值相对下降,如何让学生投入时间、专注且持续地学习变得更关键。AI大幅提高了信息获取的速率,但专注学习时间却依然是学习成效的瓶颈,而AI本身并不能直接解决学生专注度问题。

因此,与其一味提供更多内容,不如提高学习过程的趣味性和互动性,从而延长和强化学生投入学习的时间。

这就带来了一系列用户需求的迁移:学生(以及家长)对于教育产品的期待,正从"让我获得知识"转向"让我愿意学习"。

这解释了为何游戏化学习在AI时代被寄予厚望,因为它可以通过提高趣味性来确保用户的专注投入时间。例如Duolingo的成功就证明了这一点,作为一个语言学习应用公司,其本质上更像一家游戏公司,通过积分、关卡等机制让用户"上瘾"地练习。

Duolingo

在这个议题上,有创业者认为如果只是把AI技术嵌入传统机构的教学流程中(典型的To B模式),往往做不出体现AI优势的产品;真正的机会在To C端,即直接面向学习者,用AI带来原生的全新体验。

当然,这并不意味着AI要完全取代人。恰恰相反,在K12等需要高度情感陪伴的阶段,纯AI虚拟老师并非最优解。

未来主流形态很可能是"人+AI"的混合模式:AI负责提供标准化的知识讲解、个性化练习和数据分析,把老师从重复性的事务中解放出来;而真人老师聚焦于情感支持、学习习惯培养和关键节点的引导。这样的模式既发挥了AI高效精准的优势,又保留了人类教师在激励、督促方面的不可替代作用,能更好地满足学生和家长对于"有人陪伴监督"的心理需求。

值得一提的是,AI还可能改变教育服务的供给侧结构,从而进一步响应用户的新需求。有人提出社区化的"链家模式"设想:未来每个社区里都有一个"区长老师",他借助强大的AI教学平台同时服务上百个孩子(过去可能只能带十几人),通过线下邻里信任就可以直接触达用户,无需依赖昂贵的线上投放。这样一来,家长获得的是既有真人坐镇又高性价比的本地化服务。

再看更广阔的市场,AI技术降低了教育供给的门槛。借助AI实时翻译、自动生成教案等能力,未来或许一些原本受语言或专业限制的人也能胜任教学工作。例如,一位普通话标准的三线城市宝妈,可以通过AI工具在线教授外国人中文并获得收入。这将极大丰富教育供给,并利用低成本优势打开崭新的市场。

"链家模式"

3. 教育新模式的实验与观察

为了实现更强的学习参与感,不少团队开始尝试新的教学模式。以下是业内涌现的三种有代表性的实验性案例:

3.1 AI陪伴式学习

有创业团队打造了一个AI老师的服务闭环雏形,先是分析大量一对一真人课堂的录屏数据,课后通过AI音箱与学生互动、并在微信端推送练习题,实现课上课下联动。

凭借这种模式,他们在创业初期通过私域运营,在短短7-8个月内获得了千万级的收入。然而团队发现,这种形态下的AI老师主动性不足,只能在有限场景连接孩子,难以形成长期的情感陪伴。

为了增强陪伴,团队设想引入创新的硬件载体,再结合AI数字人替代真人老师完成"跟读练习"等重复且低复杂度的环节,让真人老师专注于核心讲授。通过这样的软硬件结合,建立起更紧密的情感连接,最终让孩子愿意主动学习而不是被动完成任务。

3.2 娱乐式学习

这个模式则借鉴了当下的短视频文化和沉浸式娱乐体验,将学习内容融入泛娱乐场景中。

比如,有团队尝试"抖音式学习",**用短视频流呈现真实、有趣的中文对话情景,用户可以像刷抖音一样一条条观看并学习。**又如"角色扮演 (Cosplay)"学习,用户进入预设的视频剧情,选择扮演其中一个角色(比如扮演《甄嬛传》里的皇帝),进行沉浸式的对话练习,还可以邀请朋友一起参与表演。

这些创意将学习过程游戏化、社交化,让用户在娱乐中不知不觉练习语言等技能。更重要的是,这套体系深度嵌入AI于每个环节:当用户遇到不懂的内容时,可以随时唤醒AI获得贴合上下文的解答支持。这种深度融合的模式可以确保学习体验的连贯和沉浸感。

3.3 Learning through play

第三种路径融合了动手实践与AI指导,让学习过程本身变得像玩游戏一样有趣。

有创业者分享了一个案例:**孩子在iPad上跟随AI Agent的引导,独立完成乐高积木的拼搭课程。**在这个过程中,AI既可以提供3D拼搭步骤的即时指导,又能通过摄像头识别孩子的自由创作,并给予情感丰富的点评互动。核心在于营造共情的学习伙伴:AI通过视觉和表情识别技术关注孩子情绪,在他遇到困难时主动提供提示和鼓励,帮助孩子享受动手探索的过程,而不是沮丧放弃。

为了实现这一点,团队在技术架构上采用了多智能体协作:不同的Agent分别负责课程规划、难度调整、情绪支持、创意激发等任务,各司其职又协同配合。这套产品采用To C订阅制,通过围绕一套乐高教具开发上百节不同的课程,大幅提升了实体玩具的价值和生命周期。

Lego in Education

4. 商业化困境与现实挑战

尽管AI+教育的新产品层出不穷,但真正要跑通业务,还必须直面商业化的挑战。目前普遍认为行业中存在至少三大困境。

4.1 获客成本高

眼下获取学生或家长用户的成本依然居高不下。

当一家创业公司需要扩张时,不得不依赖抖音、百度等流量平台投放广告,这导致单个用户的获客成本(CAC)非常高,利润空间被极大压缩,成为公司生存的巨大挑战。

早期阶段很多团队会尝试通过私域流量(如社群运营、转介绍)来冷启动,虽然在小规模时效果不错,但私域很难支撑指数级的用户增长。即便放眼海外,投放Meta (Facebook)等平台同样代价高昂、ROI不理想。

本质上,烧钱买量能否持续,就看用户的终身价值LTV能否覆盖高昂的获客成本。如果产品留存率、付费续费做得足够好,那么前期投放是值得的;但现实是,目前大多数AI教育产品的用户生命周期价值并不足以支撑起动辄数百元的获客投入。

4.2 家长认同门槛

即使技术和产品成熟了,还要让最终掏钱的家长买单,这里存在认知上的鸿沟。

许多家长天生对"纯AI教学"存疑,甚至有一种根深蒂固的观念——**"没有真人,服务就不值钱"。**他们愿意为一些效果不一定好、但有真人陪伴的服务(比如"一对一陪背单词")支付高价,因为真人带来了确定性和监督感。

相较之下,当看到AI老师上课,不管互动性、趣味性做得多炫,家长往往还是会质疑:这不就是换汤不换药的录播课吗?因此很难心甘情愿掏高价。

在过去,"双师课堂"的模式之所以能取得成功,很大程度上是因为名师直播授课满足了家长对名师资源的向往,辅导老师课下跟进则建立了与学生的情感连接,提高了续班率。双师模式精准击中了家长既要效果又要陪伴的心理预期。

归根结底,家长购买教育服务买的是一个"确定的结果"(例如成绩提升、升学名额),而纯AI产品目前难以提供结果担保或让家长足够信任。

双师课堂场景

4.3 产品体验"欠火候"

最后一个困境是当前业内产品本身可能还不够"让用户买账"。

有嘉宾提到一个现象:某些教育智能硬件产品(比如在抖音上热销的学习机)退货率高达40%。也就是说,即便从广告投放数据看获客是赚钱的,实际上由于大量用户在试用后退货退款,导致账面上仍然亏损。

如此惊人的退货率,反映出产品体验与用户预期存在巨大落差,用户觉得"不值"才会纷纷退货。如果不能解决真实用户痛点,提升产品真实口碑,再好的概念和技术卖点最终都会淹没在市场的真实投票中。

AI学习机

5. 面向未来的技术与生态预判

尽管困难重重,我们对于AI重塑教育产业的未来仍可以有多维度的思考和展望。

5.1 从销售先做起

有创业者提出,既然在高端细分市场中真人老师短期内仍是不可替代的,因此与其执着于让AI当老师,不如先用AI去赋能教学以外的环节,把商业链路跑通。

一个典型做法是把AI用于销售转化:针对那些年均客单价3-4万的中产家庭,有团队介绍了其开发的一套AI销售系统——能够在企业微信上自动完成从添加新客户、介绍课程产品、解答疑问、价格谈判,到最终引导付款购买试听课的全流程。

这实际上让AI承担了原本由地推顾问、课程销售执行的工作,解决了传统销售团队"管理难、培训成本高、人才流失快、业绩不稳定"等痼疾,而且据称,该团队AI销售的转化率还高于人类销售的平均水平。

有大量创业者已经取得阶段性成果——在教学环节之外的运营、营销、服务流程提升自动化和智能化程度,并且在未来会持续加大投入。

5.2 出海

另一股趋势是将目光投向海外蓝海市场。当国内教育市场竞争白热化且监管趋严时,不少团队开始探索利用AI技术优势进军海外,用中国的AI和内容去满足全球用户的教育需求。

一个备受瞩目的方向是AI助力的中文教育出海。

全球范围内,学习中文的需求正因为经贸、就业机会而爆发增长——很多外国人学中文的动力直接来自"赚钱",例如想要和中国做生意或进入中资企业工作。然而当前海外能提供高质量中文教学的老师既稀缺又昂贵,线上真人课则受制于语言沟通(需要借助英语中介)且价格高昂。

对此,有创业团队尝试打造"超拟人AI中文家教",提供母语+中文双语教学,而且定价亲民。他们的引流方法也非常独特高效:让在华留学生以主播身份在海外TikTok上双语直播教学,获取大量精准且免费的用户流量,然后将这些留学生主播形象打造成App内的数字人AI老师,形成从获客到转化的信任闭环。同时,通过集中攻克特定人群的场景(如东南亚或中东市场),积累海量真实语料来训练高度精准的垂直AI模型,建立先发优势。

5.3 先做L2级产品

在技术演进和市场博弈中,教育创业公司也开始重新思考产品定位和演进路线。初创公司切忌陷入"证明自己技术最牛"的误区,而应采取务实的渐进式策略。

这意味着产品一开始不必追求完全体的AI老师,而是可以从满足刚需入手,哪怕能力只相当于"L2级自动驾驶"——即解决掉80%的典型场景问题,剩下20%再逐步迭代。这样一边活下去、一边创造未来,通过真实业务不断打磨AI模型,用用户数据去迭代升级,而非闭门造车烧钱造"完美AI"。

也有创业者提出,在市场定位上,其将产品定义为"全流程解决方案"而非单纯的教学辅助工具。 例如做一款有AI学习App,能够覆盖从诊断测试、定制学习计划、知识讲解到练习反馈的全链路,那么它带给用户的价值就接近一所在线学校。这样企业在定价时就有底气对标线下昂贵的培训班,而不是陷入做廉价工具应用的困境。

总之,赚得到钱、站得住脚的产品形态应该是AI技术和实际教学需求的最佳结合,切忌炫技式的概念堆砌。

6. AI+教育机会在哪儿?

展望未来的3-5年,大部分人认为,AI对教育产业的重塑将是一个渐进融合的过程,而不会突然出现某个超级AI老师全面取代现有教育模式的剧变场景。

此外,在不同年龄和领域上,AI的定位也将有所区别:**高智能的AI老师可能首先在高中及以上学历教育、成人职业培训等成熟学习者市场发挥巨大价值。**这些用户自主性强、学习需求复杂,AI的强大智能正好大显身手。

而对于中小学生来说,很多时候瓶颈不在知识本身,而在于学习习惯和专注力。对于他们,也许一堂制作精良的互动录播课已经足够有效,真正欠缺的是线下督促或学习氛围,这可能需要借助智能自习室等实体场景来弥补。

可以预见的是,人类教师在未来相当长时间里仍会在育人方面扮演重要角色,但AI会成为无处不在的生产力工具:它或许不能取代人的关怀和灵感,却能够极大降低内容生产和个性化服务的成本。

现在,**用AI制作一套完整课程内容的成本可能只要过去的几十分之一甚至更低——比如20万就能完成过去需要5000万投入的课件研发。**这种成本结构的剧变将重新定义教育产品的进入门槛和竞争格局:资金充足、技术强的团队可以迅速铺开内容版图,而小而美的团队也因为成本降低有机会切入细分市场。

无法忽视的是,OpenAI、Google等巨头也正通过旗下产品将通用大模型的能力深度植入教育领域,甚至推出专门的教育版服务。

ChatGPT教育模式

当拥有着更强大的技术底座、更海量数据和更无与伦比的品牌影响力的巨头基础模型公司下场时,我们必须思考创业公司的核心竞争力究竟在哪里?

答案可能并非在于技术,至少不再是Prompt技术或者基础模型本身。任何简单的Chatbot类教育应用,都将面临被基模公司边缘化的风险。

相信一些答案已经浮现在创业者的心中,也体现在了上文的讨论中。我们将持续关注,也期待未来能看到更多这类真正落地的创新探索。