Bolt观点|你的AI产品到底该不该称为Agent

线性资本·2024年7月6日

自ChatGPT发布以来,很快就出现了如BabyAGI、AutoGPT等Agent(智能体)框架。我们可以通过让LLM自主规划和决策的形式,来解决单次提示词工程的方法很难胜任的复杂问题。紧接着越来越多的设计复杂的,包括不少专注在某一特定场景的Agent框架应运而生。Agent领域快速繁荣,以至于在我

自ChatGPT发布以来,很快就出现了如BabyAGI、AutoGPT等Agent(智能体)框架。我们可以通过让LLM自主规划和决策的形式,来解决单次提示词工程的方法很难胜任的复杂问题。紧接着越来越多的设计复杂的,包括不少专注在某一特定场景的Agent框架应运而生。Agent领域快速繁荣,以至于在我们自己的投资观察中看到的几乎所有AI应用公司都在强调自己的产品是Agent驱动、或者说自己的技术底层是Agent,即使做的仅仅是提示词工程的简单编排。正如Bolt之前的文章《一千个人眼里,有一千种Agent》所提到的,"当你聊过足够多的从业者,你会发现有一系列不同概念的东西,他们都叫做Agent"。

但究竟什么样的AI产品或系统可以称为Agent,不同Agent的差异性如何体现,类似的探讨似乎并不多见。

近期 Andrew Ng(很多人的深度学习启蒙老师)在一篇文章(点击文末阅读原文)中表达了自己的观点,他提到一个概念:Agentic System(智能体系统),他认为形容词"Agentic"比名词"Agent"能更好地帮助我们理解这类智能体的本质。因为这能让我们思考,系统能在多大程度上成为智能体,就像自动驾驶汽车具有一定程度(L1-L4)的自动驾驶能力一样,我们也可以将智能体的智能化能力视为一个频谱。关于这个频谱的大致定义,LangChain的CEO Harrison Chase也在近期的文章《What is an agent?》中给出了如下见解:

我们大致可以根据在内容输出、规划与决策层面中LLM的参与程度将一个应用的智能化程度从上到下分为6个层面。**一个系统中,LLM 决定该系统行为的程度越高,我们就可以称之为"高度Agentic"。**我们今天所听到的Agent应用大体上是指的图中4-6层级所描述的系统。比如Router(路由)类系统使用LLM将输入路由到特定的下游工作流中就,具有少量的Agentic能力。State Machine(状态机)类系统使用多个LLMs来执行多个路由步骤并且有能力确定每个步骤是继续还是完成,具有相当的Agentic能力。而Autonomous(自主体)类系统更进一步,它能够使用工具甚至创造合适的工具去推进系统的进一步决策,具备完全的Agentic能力。

今天我们看到了一些对于Agent智能程度的早期判别框架,但目前这个领域还处于初期阶段,随着Agent框架的丰富和深入,对其能力评定的新的方法论也会出现。之所以今天抛出对这类问题的好奇,我想表达的是:与其在这个人人自称Agent的时代强调自己产品的Agent属性,不如尝试回答"How agentic my system is"这个问题,这可能带来三个对产品的思考:

  • 是什么造就了我的产品目前Agentic的程度,目前还有多少人力参与的部分,这部分是否短时间内无法被替代。
  • 基于目前的现状,我可以构建什么样的壁垒。 落实到模型部分是数据,落实到人力部分是know-how,或者干脆就是在人机协同上做到更好的场景适配与体验。
  • 未来是否有变得更加Agentic的可能, 如果可能我今天应该做什么,比如是否要在架构层面做到足够的可插拔性去适应未来推理能力更强的底座模型。

当然,无论你的AI产品目前是否有Agent概念,或Agentic程度如何,**创业者最终要回答的问题是:产品是否能有效解决用户的问题。**再进一步说,是你今天能否基于技术的理解利用手边现有的框架快速找到一个合适切入的场景,来搭建一个也同样宝贵的竞争壁垒 - 时机(我的微信:bluesbaiLcz)。


Bolt Community

如果你是认同Bolt观点的AI浪潮的探索者,希望和志同道合的小伙伴一起讨论,欢迎通过扫描下面的二维码向我们简单介绍一下你自己,审核过后会邀请加入讨论。


Linear Bolt

Bolt 是线性资本为早期阶段、面向全球市场 AI 应用专门设立的投资项目。它秉持线性投资的理念和哲学,专注在技术驱动带来变革的项目,希望帮助创始人找到实现目标的最短路径,不管是行动速度,还是投资方式,Bolt 的承诺是更轻,更快,更灵活。