Agent 的第一性问题:Proactive 与 Context 经济学

五源资本五源资本·2026年4月29日

人类的注意力窗口变得前所未有稀缺。

过去一年,AI Agent 的能力上限被一路推高——模型的 context window 在不断扩张,工具调用越来越复杂,多 Agent 协作开始成为常态。但与此同时,用户使用 Agent 的体感并没有同步变好。

一个被多数玩家忽视的事实是——模型的 context window 在扩张,人类自己的Human Context Window(注意力窗口)却从未发生过变化。

当一个用户同时挂着 3 个 Claude Code、5 个浏览器标签、十几个 IM 群,意图开始大规模遗漏,任务开始大规模断点。再聪明的被动式 Agent,都填不上这个空缺——因为问题不在模型那一侧,而在人的接收带宽。

也是在过去一段时间,赛道沿着这道缝隙开始分化:

  • 被动式 Agent 正在逼近天花板——ChatGPT、Claude、Gemini 这类"等你开口"的 Agent,能力维度越来越同质化。
  • Coding Agent 是最先跑出独立打法的子赛道——Claude Code、Cursor 都在用"主动看代码、主动建议、主动执行"的方式跨过被动响应的边界。
  • 通用主动式 Agent 仍在寻找意图明确的使用场景。

主动式桌面 Agent 正是从这条线长出来的方向——它不打算让模型变得更聪明,而是去改造"模型与人的协作方式"。

AirJelly 是这条赛道上的一个具体答案,近期已经完成五源资本投资,并进入内测阶段。本期播客是五源小酒馆对AirJelly创始人黄柏特的访谈。

嘉宾 黄柏特 | AirJelly 创始人 杨煜柯 | 五源资本投资人

主播 Qianqian | 五源资本品牌负责人


01 如何输入,让Agent获得最高"信噪比"?

Qianqian: 桌面Agent 想解决什么问题?

黄柏特: 这个时代,Agent 能力持续上升,模型的上下文窗口(context window)也不断扩大,但受限于生理本能,人类的context window 始终有限。日常使用中,我们经常会丢失来自 IM、AI、各类 Agent 的意图信息。

随着 AI 能力日益增强,越来越多人开始同时使用多个 Agent 进行多线程工作,大脑已无法承受这部分负载。我们因此想做一个主动式 Agent——让人类的意图不再遗漏,让所有任务都能闭环,AirJelly 就是这样的产品。


杨煜柯: 我一直想找的其中一类创始人是——第一个提出某个概念的人。背后的本质是创新能力和定义问题的能力。国内很多创始人,具备很强的执行力,但是都在做一些拥挤的赛道。

Proactive agent这个方向从去年7月开始陆续有人开始做,但是柏特很大胆。去年10月,柏特还在字节时做了MineContext这个开源项目,第一个用截屏的方式给Agent做上下文获取,并且开放诚实地告诉用户我是这么做的,主动筛选一些早期使用者。

再到后来跟我讲 "Next-enter prediction" 时,我觉得这个概念很新且makesense,每次用户敲键盘就是确认用户的意图,这样可以给 AI 提供更精准的用户意图输入。

产品本身设计上,也是做了细心的设计。其中一个功能让我印象深刻——AirJelly可以像倒带电影一样,回看自己一天都做了什么。此外,他会在我快忘记下一个腾讯会议时主动提示:什么时间、跟谁、对方背景。这些点都非常有意思。

Qianqian: AirJelly 将"用户按下Enter键"视为重要的信息节点,这种设计背后的考量是什么?

黄柏特: 从最早的 MineContext 到 AirJelly 第一版,我们都在做全量截图,以便帮Agent更好地理解用户行为。但全量截图包含大量噪音,重点不突出。后来我们改用Enter——这是一种聚焦。

更深一层看,回车键是人类行为里少数几个"意图闭环"的动作。

人在屏幕前的大部分时间都是在游荡——滚动、悬停、切窗口,这些信号噪声比极低,因为它们属于探索,不属于决策。但当一个人在输入框里敲完一句话、按下 Enter,那一刻他已经在脑子里完成了编辑、删改、确认的全过程:Enter 之前是私密的思考流,Enter 之后是对外的承诺。

所以全量截图记录的是"这个人在场",而 Enter 记录的是"这个人在做选择"——后者才是构成意图轨迹的最小有效单元。

Qianqian: 会议类录音产品与桌面Agent的差别在哪里?

黄柏特: 音频会议类产品本质服务于人与人的对齐沟通,却错失了人与 AI 之间的 context。长期来看,90% 以上的 context 都会发生在人与 AI 之间

其次,我们的核心是记录意图。音频产品做的是全量记录加总结——而多数人真正在意的,是总结后的几个待办事项与行动建议。我们直接先一步捕获意图,信息密度因此更高。

Qianqian: 目前Airjelly的受众画像是怎样的?

黄柏特: 大致分两类。

第一类是 ADHD (注意缺陷多动障碍) 人群。他们天然多线程,又容易注意力涣散,与我们"意图收集 + 主动闭环"的理念高度契合。

第二类是 AI 重度使用者与 OPC——他们在 IM 上沟通量大、跟进事项繁多,同时是前沿 AI 工具、多线程实践的狂热践行者。此外还有一类反馈来自研究者:他们要做调研、跑实验、写内容,跨任务并行。

Qianqian: ADHD在你们看来需要被矫正吗?

黄柏特: 完全不是。过去做 ADHD 辅助工具的常规思路,是把 ADHD 当作一种病,试图将其矫正回单线程状态。但我的理解是:ADHD 的多线程特质,在 AI 时代很大程度上是一种利好——它能最大化利用多线程的工作效率。它的缺点在于:任务容易记不住,任务切换后 context 需要重新补全。

我们的做法是:一方面帮你记住所有任务,另一方面标注每个任务的当前进展与下一步动作。这样哪怕你在频繁跳动,也能稳稳接住任务。这是一种更高明的方式——辅助,而非校正

Qianqian: 用户反馈最多的 aha moment 是什么?

黄柏特: 我最近听到一个惊艳的案例。一位朋友发现自己有个订阅忘记关闭、被扣了钱,在微信群里吐槽了一句。AirJelly 捕捉到这个信号,自动调用 Browser Use,主动起草了一封退订邮件——只等他发送。他发现时说:"这实在太令人震惊了。"


02 Proactive vs Context,哪个更重要?

Qianqian: 就更好的Agent体验而言,Proactive(主动性) 更重要还是 Context(上下文) 更重要?

黄柏特: 现阶段,Proactive 更重要——因为 context 在任何时候都重要。

Agent 创业——尤其是生产力应用层——存在范式性机会与长期性机会的区分。主动式 Agent、通用 Agent(如 Manus),都是范式性机会:你必须在短期内打出声量,在这个窗口让市场记住你。而 context 的价值是长期存在的,它是我们持续积累的一层,而非对外宣发最核心的点。

前段时间红杉美国撰文介绍了海外一家叫 Block 的公司,他们在探索新的组织管理方式。这个问题的根源是:过去两千年,人类依赖的是层级制。层级制的宏观体现是"人同时只能管理 3–5 人",因此必须一层层堆叠结构;微观体现则是"人同时只能管理 3–5 个 Agent",因此才需要更多工具。

Companies move fast or slow based on information flow. Hierarchy and middle management impede information flow. For two thousand years, from the Roman contubernium to today's global enterprises, we have had no real alternative. Eight soldiers sharing a tent needed a decanus. Eighty men needed a centurion. Five thousand needed a legate. The question was never whether you needed layers. The question was whether humans were the only option for what those layers do. They aren't anymore.


我们想做的事,在宏观与微观层面是同构的——都在解决"人类注意力窗口有限"这一问题。

未来我们会推出 AirJelly 的 Team 版本。团队内部不再依赖"对齐会议"这样的批次信息处理——你可以随时查看同事的 Airjelly,了解他近期在做什么,context 由此更充分地流转。基于此,人类的组织模式或许会迎来变革式的机会。这是我们长期最兴奋的事。

Qianqian: 人与 AI 的合作边界是什么?

黄柏特: 人的作用更多在于关键节点的判断。打个比方——你是 Founder,下面有工程负责人、GPM 负责人,他们产出具体方案交给你 Review 与决策。未来人的角色也是如此。AI 越来越聪明,许多代码已直接由 AI 编写,没人再一行行 review。当 AI 拿到更全面的 context,它成为任务发起方与执行方的可能性也更大。但决策这一步,最终仍应交由人类

Qianqian: 团队版的 AirJelly Agent 归属员工还是公司?

黄柏特: 应归属员工。理想形态是:大家以"项目"或"群组"的形式协作,每个人带着自己的 Agent 进入,选择性地分享 context 或 task。既保护隐私,也能最大化让用户用起来。

如果 Agent 归属公司层,就会沦为"老板监控员工"的工具——员工会以各种方式规避使用,效果反而不会好。


03 拿破仑、黑格尔,与世界精神的推背感

Qianqian: 你曾说出来创业是源于"推背感",怎么理解?

黄柏特: 推背感是一种通俗说法。我平时喜欢读历史与哲学——黑格尔对"推背感"有一个更学术的表达,叫"世界精神"。

世界精神讲的是,拿破仑最初只是科西嘉岛上的普通人,法国大革命让他年纪轻轻就登上了很高的位置。1806 年他进入耶拿——那正是黑格尔当时所在的城市。按常理他是以侵略者身份进入,但黑格尔认为,是"世界精神"推动着拿破仑,把资产阶级的进步思想带到了各处。

在大时代变革中,需要有人去做推进性的事。我自己 21 年就选择了人工智能,彼时 ChatGPT 尚未爆发。原本我打算做 research,拿到复旦的 PhD offer,却阴差阳错未能入学。

我家是温州人,做生意的。父亲赶上了改革开放那一代,30 年后 AI 时代又至。25 年毕业这个节点,虽然我只是一名校招毕业生,但对商业的感知、street smart、Building in Public 的经验,以及 AI research 与开源产品的积累——都已具备。这一切仿佛是命运给我的强烈感召与推背,于是我选择出来。

Qianqian: 煜柯,柏特最打动你的点是什么?

杨煜柯: 我觉得有两点。去年柏特见我们IC的时候23岁,但是现场非常从容自信,没有一丝局促。IC快结束的时候,柏特说,希望IC们再多提一些问题。这跟一些创始人希望IC少提问恰恰相反。我觉得这样自信和底气来自于他对自己产品的熟悉了解、对用户有充沛的一线观察和感受,不会把见IC当考试,而是照镜子,作为一个途径更好迭代自己的产品。

另一点印象深刻的是,后续我在使用AirJelly的过程中经常反馈问题,这些问题基本都是当天内完成更新。这个执行力真的非常惊人。

Qianqian: 柏特你现在想清楚自己心中的使命了吗?

黄柏特: 一个大的使命是:AI 时代到来后,人类与 Agent 的协作、以及人类之间的协作关系,都会被大幅重塑。我们置身于生产力产品的第一线——既面向个人,也面向未来的组织。只要产品做得足够大、足够有影响力,人与人、人与硅基生命的格局就会被影响。我们未必是那个决定性的角色,但希望通过自己的努力,让未来的硅基文明与碳基文明形成更好的形态

五源寻找、支持、激励孤独的创业者,为其提供从精神到所有经营运作的支持。我们相信,如果别人眼中疯狂的你,开始被相信,世界将会别开生面。

BEIJING·SHANGHAI·SHENZHEN·HONGKONG

WWW.5YCAP.COM