Opus 4.5之后,AI正在催生“巨头型百人公司”
迭代速度重于一切。
Opus 4.5发布之后的半年里,Agent赛道完成了一次悄无声息地洗牌。模型层之间的对话差异已经很难被普通用户感知——真正把模型差距拉开的,是Agent Loop这一层。Claude Code第一次让模型的长任务规划能力、工具调用积极性变得肉眼可见;Opus 4.5把语言模型推入了Agent时代;"套壳"争议逐渐被产品力证伪。
而在这条主旋律之外,还有一条更隐秘的暗线:当生产主体从"被工具辅助的人"切换到"能独立完成工作的Agent",原本围绕"人作为生产主体"建立的产品、组织和商业默认值都需要被重新提问——开源的意义、ToB的收费方式、产品该听谁的、组织规模与产值的关系,每一个在Chapter 1(ChatGPT 3.5)时代被认为已经定型的命题,都在Chapter 2(Opus 4.5)里被重新打开。
Cherry Studio是这条暗线上一个值得拆解的样本。围绕它,我们和创始人Yinsen、五源资本投资人Steven聊了一些当下行业里比较少见的判断。
嘉宾
Yinsen | Cherry Studio 创始人
Steven | 五源资本投资人
主持人
Qianqian | 五源资本品牌负责人
Highlights
- 今天AI公司能真正称得上护城河的,只有两种资产:好团队和好用户。
- 开源在AI时代是非对称迭代的工程基础设施——美国最前沿的startup已经在用work trial替代面试;Claude Code、OpenClaw之所以能做到每周三个版本,是因为2/3的roadmap都来自开源社区的issues。
- "找最大公约数"的产品方法论在Agent时代失效,豆包的产品经理不该听正态分布中间的用户诉求,应该听那些"有能力写issues"的人。
- Opus 4.5 是开启了语言模型Chapter 2的最重要范式:最强模型 × 最强use case × 最强用户的飞轮已经彻底转起来。
- "没被中国ToB毒打过"反而是新一代AI创业者的优势——Sell Work正在替代SaaS。
- 下一个时代最厉害的公司不是one person company,而是"巨头型百人公司"。
以下是我们整理后的核心观点:
01 Adoption层:被"套壳"二字掩盖的独立价值
Qianqian: 怎么理解"套壳",是不是一种被低估的用户需求?
Yinsen: 我觉得是被严重低估的。我们现在把它分三层——第一层是模型层,第二层是今天Agent runtime这一层,再上层我们不叫"应用层",而是叫Adoption层——它包含了"应用"和"如何被使用"两个关键要素。
今天大家都在怀疑应用层是不是太薄了、是不是会被模型原厂吃掉。但被忽略的是"如何被使用"这一层。模型的能力越强,Agent能做的事情越多,它在纷繁复杂的世界中遇到的挑战越多——就像一个实习生,交给他的任务都很简单;但一旦他成为独当一面的业务负责人,挑战一定非常多。
模型原厂关注通用性、最大公约数;做"壳"的人关注具体场景的真实实践——把Agent真正嵌入一个工程师、一个法务、一个IT同学的日常工作流里去。这些使用场景的真正落地,是壳带来的价值。
Steven: 我的视角不太一样。我的观察是——最好的壳拥有最好的用户。今天这些AI公司,除了模型公司之外,他们手上能称得上是护城河的资产其实只有两种:一种是特别好的团队,另一种是特别好的用户。其他的都很难持续积累。
无论是之前的Monica,还是今天的Cherry Studio,他们都对应了那个时间节点上一批最先进、最好的AI用户。
02 开源的新意义:从生态契约到非对称迭代
Qianqian: 怎么看待开源?它在AI时代的意义和过去一样吗?
Yinsen: 开源在不同时代有不同意义。AI之前,开源能形成非常好的生态,避免重复造轮子——Linux系统、各种基础组件库都是这样长起来的。但在AI之后,代码开放本身的价值在降低——大量代码已经由AI生成,AI又是在大量开源代码上训练的。但另一个角度的价值在变高——就是build in public的价值。代码开放,意味着你和市场、和用户之间有更顺畅的反馈通道。
Steven: 我其实投了非常多的开源项目,从2023年ChatGPT发了半年之后的第一个Multi-Agent框架Camel,到Dify、Kimi、Cherry Studio。我从DeepSeek、Anthropic这些正向样本里学到的最大一课是——团队是AI公司最核心的资产。不是ARR、不是用户、不是网络效应、不是融资,最核心的资产是团队。
而开源是recruit适合每个团队的最佳手段。它验证了几个非常重要的假设——通过开源吸引来的人,跟已有团队有很好的culture fit,并且有非常高的agency。这是今天AI native团队最重视的东西。
更前沿的形态是——美国最前沿的一批startup已经在尝试用work trial代替job interview。让候选人来一起工作三到五天,甚至一天,都比传统面试更有意义。我想知道的是你有多会使用Claude Code,而不是你多会讲。
开源还有一层意义,是在过去半年才开始展示出来的——产品迭代上的非对称性优势。Claude Code、OpenClaw这两个团队的发版速度惊人,可以做到每周三个版本,且都是解决挺重要的功能。
为什么?因为他们的roadmap是建立在开源社区的issues之上的。假设我有100个issues,如果我是Claude Code的Boris(Claude Code工程负责人),我只需要从中抽象出10个最该优先解决的问题,让Claude Code去解决。你不需要像传统产品经理那样去定义"我要为用户做什么"——2/3的事情是从开源社区里衍生出来的。
我有一个暴论——今天豆包的产品经理可能不应该听一个正态分布下3 Sigma的豆包用户的诉求,这对于做Agent没有帮助。
03 为什么不该听"中位用户"的反馈
Qianqian: 你们观察到的用户价值差异有多大?
Yinsen: Agent时代用户的价值方差极其大。我们有用户一个月能消耗1000美金的token;也有用户充10美金两个月也用不完。他们的价值是完全不对等的。
过去讲软件只有两种——一种是没人用的,一种是全是问题的。因为软件但凡被高强度使用,一定会暴露非常多的问题。但很多软件走不到这一步。开源在这点上有优势。
更关键的是——未来写代码的部分能力被AI取代之后,它变得不稀缺了。真正稀缺的是需求——是来源于用户真实的高质量的需求。谁有需求,谁的产品就可以高速迭代;没有需求的产品,AI也不知道该怎么写,会陷入死亡螺旋。
Steven: 这和之前的互联网产品有巨大区别。今天同样是用户,用户和用户之间的价值变得非常不均匀。互联网产品一直在寻求最大公约数,找到共性、解决它,获取最大流量。但Agent在今天看起来这个方差极其大。
这也是最开始Cherry Studio比较吸引我的地方。我们俩刚认识的时候,founders来找我做pitch meeting的时候,他们电脑上投屏,我会看到一个图标我不认识——发现是Cherry Studio。中国最好的一批AI用户,有一波几乎全部都在Cherry Studio上。
Yinsen: Cherry Studio没有做coding场景——那个场景的know-how非常具象,而且一定是模型原厂的生意,作为第三方产品没机会。我们关注的是非coding的通用任务,所以很早就聚集了一帮高生产价值的知识工作者,他们没有技术背景。
最早是技术背景的硬核用户先用,他们把产品用透之后在小红书、公众号、抖音写教程——这些平台最容易触达知识工作者。后来出现一类用户——他们文本工作量大,其他产品满足不了,Cherry Studio知识库结合DeepSeek解决了他们的问题。有一次一个用户反馈问题,我让他截张图,他说他不会截图。但他在迫切地用Cherry Studio。那一刻我意识到——用户画像在发生转移。
04 Claude Code飞轮如何转起来
Qianqian: "Claude Code难以超越"是不是Agent行业共识?
Steven: 我觉得不是共识。如果我们同意"你很难超越Claude Code"的话,那各种Agent Infra项目都不用做了——等着Claude来教你怎么做就完事了。这肯定不是共识,但我这是一个比较现实主义的保守看法。
你做得比Claude Code更好是很难的,不是因为Boris比我们有更好的聪明才智——是因为他有最强的模型。最强的模型generate出最强的use case,这些use case又对应最强的用户——他的飞轮是彻底转起来的。后面追赶做各种agent框架设计的人,其实是不容易catch up的,这是一个非常现实的优势。
Yinsen: 用浏览器内核类比——从Mozilla,到Safari的WebKit,再到Chrome的Blink,今天看没有哪一个浏览器是不用Blink内核的。这不意味着Google的技术能力最强,而是它已经成了事实标准。所有网页前端都是以Blink渲染效果最好为目标去设计开发的。它经历了大量use case的验证,变成了这个世界的标准。
Steven: 这个timing让我想起2017、2018年的抖音和TikTok。那时大家想各种办法做更好的短视频交互、做创新,但过了十年发现——Musical.ly发明的那套交互范式就是最好的。Musical.ly的飞轮真正转起来,是当它的交互范式遇上了字节跳动的算法之后。在那之前,因为算法不一样,这个飞轮没有那么完美地转起来。今天的turning point是像Claude Code这样的产品在Opus 4.5发布之后——这个loop彻底转起来了。
ChatGPT 3.5是Chapter 1,Opus 4.5是Chapter 2——到Chapter 2就彻底是Agent时代了。但如果我们继续用Sonnet 3.5——这种模型跑不起来。你有再好的harness、再brilliant的context management也没有意义。
Yinsen: 正确的用户一定会在正确的模型和正确的框架之上自然出现。就像抖音的上下滑交互和推荐算法有了之后,一定会出现沉迷它的用户。
05 中国ToB的非共识窗口:没被毒打过反而是优势
Qianqian: 怎么看待Cherry Studio选择的ToB赛道?
**Steven:**Cherry Studio选择ToB,而且是中国ToB——这两个词放在一起,在中国投资市场会吓跑绝大多数人。 我是无知者无畏,我之前没有在中国ToB上亏过钱。所以我仍然对这个命题有强烈兴趣。我觉得AI对ToB效率工具的变量,要比之前云计算时代更大,甚至商业模式上会有比较大的变量。
之前SaaS从结果上看不是那么适合中国的商业模式。但AI这种use case导向的、价值主张更明显的商业模式,我觉得在中国可能会有完全意想不到的惊喜。
而且Yinsen之前的经历也满足我的很多幻想——我的一个假设是:这个人最好之前没怎么做过中国ToB,就像我一样,大家最好都不要被毒打过。
Yinsen: 我确实没什么ToB经历,唯一一段比较ToB的是在依图,因为上一代AI公司都是以ToB / ToG为主。我对做ToB这件事没有执念,也不排斥。我的逻辑很简单——这一波AI带来最大的变革是生产力的变革。企业是社会生产力最直接、最重要的载体,提升生产力的技术就应该用在生产主体的组织当中。
Steven: 从商业路径设计上,Sell Work这种方式更适合创业公司——它相对大厂有非对称性优势。大厂原来业务的天花板远超VC想象。比如字节,如果不是因为AI,去年可能有几百亿美金利润。如果创业公司把整个中国法律服务市场全垄断了,对字节来说有多大意义?但对创业公司,这带来的增量变化是不得了的。医疗、会计、各种professional service同理。
对巨头ToC平台公司来说,这边新的增量是一个比较鸡肋的存在——但对创业公司是alpha。非对称恰好藏在这种"看不上"里。你要坚信技术本身带来的红利,比市场环境更重要。我们应该先去满足技术红利、拥抱技术红利,然后再去满足用户需求。
Qianqian: 怎么理解"释放技术红利"?
**Yinsen:**2025年三四月份,有一个点让我焦虑——我发现不同模型在对话体验上的差异越来越小、越来越不被感知。那会用最强的GPT 4.5、Claude 3.7,还是国内的千问,体验差异已经非常小了。也就意味着Cherry Studio当时的产品形态已经不能把模型最长板的优势发挥出来了。Benchmark在失效——产品没有把模型红利最大化释放。
我们真正找到解法是看到Claude Code发布之后。Claude Code一出来,大家原形毕露——模型的长任务规划能力、工具调用积极性、最终交付效果天差地别。那会儿我们看到真正的机会就在于Agent——Agent可以把模型的表现差异再一次拉大,把模型红利再一次释放出来。
06 组织熵减
百人巨头公司即将出现
**Qianqian:**ToB工具之于一个组织的终极使命是什么?
Yinsen: 从生物角度看,从单细胞到多细胞、到组织、到器官、到有运动能力的个体,系统复杂度越来越高、上限也越来越高。但里面大量的信息传递和物质交换,成了很重要的开销——某种程度上是不如单细胞个体更高效的,但这又是必然的选择。
组织也一样。组织从两个人到200人到2000人,每个人花在对齐上的时间和代价快速增长。组织里分无数层,本质上只是上传下达——收集执行结果向上汇报、拿到上层目标拆解到下面,这个过程会夹杂大量信息失真和个人主观色彩,让组织熵增非常快。
但在AI阶段,上传下达天然可以被AI解决。过去的OKR拆解到执行层,根本对不上,面目全非,也没人有能力去检查每一个人。但Agent AI可以做到这件事——它可以非常严肃、非常清晰地去对齐。以后Agent之间直接通过上下文交换信息,带宽非常高,失真非常少,会大幅降低熵增的趋势。
用工业革命类比——手工业时代靠手工打磨,产品一致性非常差。但在流水线时代,产品的生产主体不是人而是机器,公差被控制在非常小的范围。以后知识工作也会从手工业变成工业化,这里面的熵增会被降到前所未有的水平。
Qianqian: 未来超大型组织会是主流吗?
Yinsen: 我觉得还会有产值这么高的公司,但组织里的人不会需要这么多了,它会变得很扁平。可能原来一个10万人的公司,1000人就够了。更小的公司可以产生更高产值。
熵增控制不仅发生在组织内部,也发生在组织和组织之间——比如供应链。一个简单的结构件,背后有模具厂、注塑厂、料厂、喷漆厂——过去这是一个网状的大型组织,沟通效率比组织内部更低。如果这种协作网络的熵增变得非常小,意味着社会财富发展速度会变得非常快。
Steven: 这个世界上因为有马太效应,所以下一个时代最厉害的公司一定不是one person company——但会有非常厉害的百人公司、巨头型百人公司。
Yinsen: 个体公司局限性非常多,组织缺乏韧性、脆弱、难长成参天大树。但百人公司、几百人公司一定会出现非常厉害的巨头。我觉得有两个方面。第一是对AI的态度是积极的——看动作,不看他讲什么。量化指标就是TOKEN消耗。很多人说拿TOKEN消耗量做考核的老板都是xx——我就是这样。但你要先让TOKEN消耗量上去,先不要去追求哪部分有效、哪部分无效——大家一定会在过程中摸索出不同的手感。就像写毛笔字,你先不要讲技巧,先把三大缸水写完。
更量化地讲,看公司给员工配了多少TOKEN的预算、多少配额。很多公司说很拥抱AI、很喜欢AI,但给员工买个100块钱的Claude都不舍得——那这种公司就不是真拥抱AI。
第二是看AI给组织形态、组织层级、组织规模带来变化之后——什么样的公司在社会生产总值中占比会提高。我们现在看到的是中等、中小公司增速最快。对巨头来说,本质上10万人不是他的短板,他的短板在业务天花板。但1000人的公司业务天花板可能很高,只是缺人——这部分的增量非常快。

五源寻找、支持、激励孤独的创业者,为其提供从精神到所有经营运作的支持。我们相信,如果别人眼中疯狂的你,开始被相信,世界将会别开生面。
BEIJING·SHANGHAI·SHENZHEN·HONGKONG
