云启研报 | AI应用2025新技术与新趋势分析解读

云启资本·2025年4月30日·20·1

从本质看方向

**2025年，大模型能力继续进化，AI应用也进入加速落地阶段。中国应用在全球AI应用领域的崛起、AI Agent技术从实验室深入到企业工作流……AI正从故事变现实。但与此同时，创新、差异化、商业化等仍是AI应用面临的难题。

本期「云启研报」和你分享云启投资团队近期关于AI应用的深度研究。研究驱动，看清方向，一起解码这场智能革命背后的机遇和挑战。

本文包括的核心洞察 包括但不限于以下内容：

技术拐点-模型回归预训练，内容窗口扩展重构AI能力边界
应用进化-从LLM到自主智能体：AI应用五个周期的演进路径解析
企业落地-深度RAG与业务融合：企业AI应用落地的关键引擎
生态进化-MCP标准化：Agent互联互通的新基础设施
商业启示-快增长、高人效：来自AI Native应用的启示

AI 动态新观察：

模型、应用新拐点

模型层

· 预训练重回焦点，基础智能再成核心目标

Open AI在pre-training（预训练）进展缓慢，加上DeepSeek推理模型R1模型火爆出圈，一度让业界将焦点转向post-training（后训练）。但随着推理深度、多模态成为AI能力竞争的新战场，领先企业（开始回归大规模、系统性的预训练路线，Anthropic 发布的Claude 3.7即是一例。相比于过去半年多侧重对齐和指令微调的路线，领先AI公司重新将"构建智能能力本身"置于核心位置。

· 内容窗口扩展，模型记忆力跃升

2025年以来，模型的token上限呈现爆发式增长。以Gemini 1.5 Pro为代表，官方称其处理能力100万token级别，能够轻松消化完整代码库、冗长学术论文，甚至整部小说——这使其成为目前已知支持最长上下文的主流模型之一。

这一新进展给文档问答、多轮对话记忆和全项目级代码理解等高级能力上带来显著提升，也实现了经济层面的优化。其降低了复杂任务的处理成本，减少了重复描述上下文的token消耗。在AI应用日益复杂、token使用量持续增长的背景下，内容窗口的扩展正带来智能水平提升与成本优化的"双赢"。

· 新范式崭露头角，训练模式持续迭代

大模型发展的新范式也开始在行业实践中出现轮廓，如online learning、long context/memory等。尽管下一代模型架构的尚未可知，但是业界新尝试正让我们看到模型智能进一步涌现的可能。

应用层

· 全球头部AI应用中，中国应用占比显著提升

在2025年第一季度，a16z发布的TOP50全球AI应用榜单中，中国企业的应用数量达到了19个，占比近40%，显著高于以往。这些应用不仅涵盖了大模型的应用，还有一些纯粹的应用场景，反映出中国在全球AI应用领域的快速崛起。

· Agent的终极形态：深度理解用户需求的智能系统

AI Agent正在逐步发展成为能够深度理解用户需求的智能系统。它整合了计算机操作、网络搜索及多种软件功能/数据，逐步实现了复杂任务的自动化执行。通过模型智能与任务落地的双向驱动，企业AI Agent正在逐步落地，并持续推动AGI（通用人工智能）的实现。

· 当前挑战：可靠性、泛化能力和成本问题

尽管AI Agent展现出强大的潜力，但其在实际应用中仍面临一些挑战。可靠性不足、泛化能力不强以及效率和成本不匹配是亟待解决的问题。例如Manus每月200美元的订阅费，使用时的token消耗也很高。这使得企业在投入时面临较大风险和成本压力。

随着应用逐渐追求泛化性与一致性的平衡。长期来看，底层模型仍然是应用发展的核心依赖。许多应用能够成功与否，往往与其具体使用方式和模型训练的深度有关。

应用创新本质：

新能力、新交互

AI技术持续进化之下，被AI化的应用和原生AI应用均在井喷涌现。在差异化已是突围"必杀技"的竞争格局下，什么样的AI应用能够令人耳目一新？我们从AI技术的进化过程和AI应用的底层架构来做剖析。

底层架构角度

当前AI应用普遍采用"前端+后端"的双层架构模式。其中，前端即用户交互端，以智能对话为核心，融合文字、语音、图片、视频等多元交互方式。这也是直接关联用户AI功能的一端。前端交互模式的创新是AI应用创新的一个重要维度，例如通过多模态输入、输出的灵活组合带给用户全新的使用体验。典型如notebookLM，以播客作为内容生成方式输出给用户。

后端则是AI应用真正的"大脑"所在，涉及到具体的任务执行。在后端运行流程里，用户的输入首先会被传递给"强化学习+小模型"组合，完成用户意图理解这一关键步骤。接着进入规划阶段，生成自动工作流并按序执行各项任务。这些任务由大语言模型(LLM)作为核心引擎来驱动，同时配合两大类组件：一是RAG与记忆模块（包括知识图谱、各类数据库等），另一类是丰富的工具使用能力（如MCP组件、应用接口和数据源）。

理想情况下，这套系统应该有"监督判断"和"反思机制"两大闭环设计，能够基于执行结果进行自我评估和调整。但现实是大多数应用还停留在"输出结果就结束"的阶段，缺乏有效的反馈调整机制。

因此，后端模型能力的持续更新是AI应用创新的另一个维度。其中，做好泛化性和一致性的平衡是模型能力优化的重点。

技术进化角度

2023年至今，随着AI技术能力逐步迭代，AI应用的产品形态经过了以下五个周期的演进：

· 模型即产品（LLM as Product）

这一阶段AI技术主要是通过大语言模型（LLM）作为产品应用，像ChatGPT、DeepSeek等，广泛应用于文本生成、搜索引擎优化等领域。

· Copilot

指将早期模型能力嵌入具体场景，主要以嵌入式插件、浮窗等形态落地，产品定义主要依靠prompt enginneering，智能程度取决于如何把用户的意图转化为模型能够理解并产生理想输出的Prompt。

· Tool+Engineering

工程化手段补足模型能力；RAG+Tool Use 不断深化，代表产品如Glean、Sana等企业搜索、企业知识库。

· 框架Agent（Framework Agent）

指围绕智能体（Agent）设计出一套结构化的思考框架，专门用来处理复杂、需要多步骤推理的任务。这一阶段具备更强的推理、执行、记忆和规划能力，应用能在任务中自己拆解步骤、记住中间状态、灵活调整行动。

这种智能体通常基于「工作流式规划」，也就是像搭建一条流水线一样，把复杂任务分成不同节点，一步步完成。代表性的应用如LangGraph、Coze。

· Agentic AI（自主智能体）

时至2025年，Agentic AI（自主智能体）周期来临。强化学习+大语言模型（RL+LLM）使得自主智能体能独立完成任务，并在多个领域自我进化。Q1爆火的Manus形态初步定义了Agentic AI的方式，但我们可以预见未来的Agentic AI 应该是不完全基于workflow、更加通用的形态。

这几个阶段的演化进程均暗含着一个逻辑：平衡泛化性和结果的准确性是优质AI应用的核心。

企业级应用落地关键：

业务理解与深度RAG

数字化基础良好的企业场景是AI技术落地的巨大"田野"。目前企业级AI应用正从概念验证阶段迈向实际落地，但在AI能力与实际业务结合中仍面临诸多挑战。下面我们把目光聚焦到企业级应用，从企业软件栈演进基础和落地关键能力两个角度，剖析AI时代的企业软件的能力重心发生了怎样的变化。

企业软件栈演进

企业软件技术栈每个演化阶段都展现出不同程度的技术能力解放和业务关注点转移。具体而言，企业IT架构经历了以下几个发展阶段：

· On-Premise时代： 企业需自行购买硬件、部署数据库(DBMS)和应用系统，技术栈全部由客户自行管理。

· IaaS时代： 硬件层被虚拟化，企业不再直接管理物理设备，硬件和虚拟化层由IaaS供应商接管，但企业仍需管理数据库和应用层。

· PaaS时代： 中间件和微服务被平台化，数据库管理也被纳入PaaS范畴，企业主要关注应用的定义和业务流程/分析。

· SaaS时代： 应用层被标准化，企业只需定义业务如何使用这些应用，而不必关心应用本身的开发和维护。

· AI时代： 企业与系统的交互方式发生质变。企业不再需要通过传统界面寻找和调用各种功能与服务，而是通过Agent实现语义化和交互化的业务操作。这也意味着企业不必再关注底层技术细节，而是可以将注意力集中在业务本质需求上。

以上演进过程揭示了企业AI转型的核心趋势：随着底层技术能力不断被解构，企业能够专注于业务本质需求和交互。

大模型时代，业务需要理解的本质是语义化和交互化。企业只需关注业务本质需求，而Agent则作为构建在所有系统和数据之上的微调层，专门设计来满足企业特定需求。这一趋势也创造了大量供应商机会。

企业应用落地核心能力：RAG

RAG(检索增强生成技术,Retrieval Augmented Generation)解决了大模型应用中的核心痛点：如何让AI理解企业特有知识并基于此生成有价值的输出。我们认为，RAG是企业应用落地的核心能力。

RAG的核心流程主要涉及三个环节：Pre-Retrieval阶段，理解用户意图并转化为查询;Post-Retrieval阶段，对检索结果进行ranking和优化处理，再结合LLM输出；Graph RAG，将物理数据转为知识图谱，构建关系网络，分层结构优化ranking。

观察RAG实现路径，我们发现不同数据类型需采用差异化处理策略：对结构化数据（如企业的销售记录、财务数据），Text-to-SQL路径往往更高效。这类数据本身无语义特性，直接SQL查询比通用向量检索更准确、响应更快。而面对非结构化数据（如产品文档、客户反馈），则需通过Embedding向量化处理建立语义映射关系。用户查询与企业知识库的匹配不再是简单的关键词对应，而是更深层次的语义理解。

其中值得关注的是，为了解决企业数据分散与异构问题，大家会引入知识图谱作为RAG的核心组件，也就是进入到上文提及的Graph RAG环节，使系统能够建立实体间关联，极大提升了复杂业务场景下的检索质量。而要想在其中做的更好，需要有深入的行业knowhow，连接企业专有知识与AI能力。

Agent生态进化：

MCP带来的改变

行业knowhow的重要性日益凸显的同时，Agent生态的互联互通趋势也为AI应用的创新落地营造了更肥沃的土壤。一个具有标志性意义的节点是Anthropic2014年11月发布的MCP（模型上下文协议，Model Context Protocol）。

MCP 旨在为开发者提供接入大模型的统一接口，从而简化不同AI系统与数据源之间的集成过程。这一协议得到OpenAI、Google、阿里、腾讯等海内外头部科技大厂的采用，迅速成为Agent领域的行业标准。

在技术架构方面，MCP体系定义并配置了MCP Server和工具库。客户端任务可被分发至不同的MCP Server节点，再由各节点调用对应的应用能力，形成完整的处理流程。

我们认为，MCP成为统一标准的意义大于MCP能力本身的意义。

短期来看，MCP标准能够提升系统效率并促进生态繁荣。它提供了更轻量化的工具调用方式，降低了Agent对复杂工具的调用门槛，使其能力边界得到扩展，理论上有益于Kill App的诞生。这一标准化进程也为开发者和企业提供更统一、高效的开发环境，推动整个Agent生态向更成熟的方向发展。

长期视角下，MCP标准将为创新的调度模式和全新商业模式提供基础架构支持。各类泛互联网应用可以快速适配API至MCP Server供调用，实现灵活的路由规则分发，并支持按量收费、广告等多元商业模式。

但值得注意的是，当前架构仍存在几个待解决的技术挑战：LLM对不同类型MCP Server的调度会存在准确性问题；未来还需要深入思考应用层和协议进一步优化的关键点；此外，统一调度router的微分发规则、调度分发或数据分发的商业模式有待探索；不同应用开发的API也将进一步丰富，未来或许出现类似Zapier的机会，或在垂直领域催生Zapier式的集成平台。

商业的答案：

AI Native应用快速增长的启示

AI创新终究是一门实践的科学。基于技术演进和生态进化剖析之后，我们回归到市场本身，从AI Native应用的市场增长中捕捉应用出海的商业化规律。

从产品增长周期来看，我们发现，AI Native应用显著快于SaaS，且人效奇高。头部SaaS公司人效一般在数十万美金级别，而头部AI Native应用公司人效可达数百万美金。

从细分赛道来看，Cursor、Lovable、Bolt.new等AI编程工具的增长态势尤为强劲。这些公司不仅营销策略得当，产品力与竞争壁垒也同样难以忽视。

另需要注意的是，AI应用的增长路线呈现明显的阶段性特征，此间伴随增长策略的转变。这也意味着，不同增长阶段(0-1, 1-10, 10-100)需要采取差异化策略，以及相应的产品品类。

· 初期（6-10个月）： 迅速增长期，从产品发布到达成1000万美元ARR，对应约5万-10万付费用户

· 中期（1000万-3000万美元ARR） ：进入平台期，此时用户规模扩大到约30万，增长速度受到市场容量和产品成熟度限制

· 后期（3000万美元ARR以上）： 需要从PLG(产品主导增长)转向SLG(销售主导增长)策略，寻求突破

最后，我们总结了现象级产品的几个通常具备的三个共性要素给出海应用创业者一些参考：

· **产品定位-**海外市场偏好极简设计但功能极致的产品；

· **市场时机-**把握市场窗口期，借助模型迭代升级热点快速推广；

· **增长策略-**流量、口碑、评价、迭代等几个方面需要特别关注。