我们在Moltbook上有了一个Agent
让Token再飞一会儿


过去一段时间里,围绕OpenClaw与Moltbook的讨论迅速升温。它们被频繁描述为"未来的个人Agent"或"Agent社交"的雏形,尤其是后者,在不少讨论中被视作某种接近"以Agent为中心的未来社交"的早期形态。
作为一家投资机构,我们也非常好奇,在褪去概念的外衣后,这些新形态产品将如何在真实的业务土壤中生长。
基于这一背景,我们对OpenClaw与Moltbook进行了一次实测:包括OpenClaw的部署方式、使用成本与稳定性,以及Moltbook上Agent的社交行为、信息传播特征和将其作为deal sourcing渠道的尝试。
我们无意于在Agent的萌芽期就给出某种定论式的预判,因为过早的乐观或傲慢往往会遮蔽技术本身的真相。本文意在将这次实际运行中的观察与思考真实记录下来,希望以此激发更务实的讨论,希望对大家有所启发。
目录:
- 被打包出售的不确定性
- Agent的传声筒游戏
- 寻找人与Agent时代的SEO
- 成本与不可控的边界
- Agent的寒武纪时代

1. 基础设施:被打包出售的不确定性
在具体测试开始前,我们首先需要为OpenClaw选择一个稳定的运行环境。
理论上,OpenClaw可以直接部署在本机电脑上运行,但出于对信息安全和权限隔离的考虑,我们最终选择在国内某云厂商购买云服务器作为其运行平台,这一选择也与我们观察到的多数用户实践较为一致,也有不少开发者倾向于使用独立设备(如Mac Mini)运行OpenClaw,都是为了避免其与日常工作环境产生过深耦合。
在购买过程中,我们观察到几乎所有的国内云平台都已经开始将预装OpenClaw的服务器与Token套餐打包作为标准化产品售卖,并且配置好了Web端的对话界面。用户在不需要进行复杂配置的情况下,便可以实现购买、点击链接、运行的流程。
这种商品化路径本身也很有趣,**当Agent尚处在高度探索和不确定阶段时,围绕其运行所需的算力与基础环境,已经可以被提前转化为确定的资源消耗与计费对象。即便应用层的价值尚未收敛,底层平台仍然能够通过提供基础设施持续获利。
在模型选择上,我们在性能与成本之间做了权衡后最终选用了Kimi k2.5模型。这一过程相对顺畅,因为OpenClaw官方已经实现了对Kimi API的原生支持,可以直接作为底层模型接入。
我们也发现这似乎也是一个趋势,Kimi官方2月4日分享的 OpenRouter 数据显示,Kimi K2.5是OpenClaw平台调用数量最多的模型。尽管Claude系列的模型能力可能更强,但在OpenClaw这种会大量消耗Token的场景中,大部分的用户还是会更看重成本。

OpenClaw 官宣接入Kimi K2.5(左);Kimi K2.5登顶该平台调用量榜首(右)
但需要注意的是,OpenClaw默认配置中使用的是Kimi国际版API的baseURL(https://api.moonshot.ai/v1);若使用国内购买的Kimi API。则需要将baseURL调整为国内接口(https://api.moonshot.cn/v1),否则会出现无法正常调用的情况。
(注:截至发稿,OpenClaw已经更新了不同版本kimi api的自由选择,这类问题不再存在)
完成模型与运行环境配置后,我们将OpenClaw接入了Telegram Bot,作为Agent的主要交互入口。在角色设定上,我们将该Agent明确定位为一名"来自Monolith的专业投资人",并向其提供了包括机构背景、关注方向和基本工作偏好在内的一些必要上下文信息。

为Agent进行角色身份设定
在完成上述准备后,我们让该Agent自行完成Moltbook的注册流程。它为自己选择了Monolith_VC作为用户名,在我们完成认领后,便开始在Moltbook社区中进行自由浏览与互动。整个实测正式进入运行阶段。
2. Sourcing实测:Agent的传声筒游戏
我们首先将Agent接入Moltbook,并未立即赋予明确任务,而是先让其在平台内进行一段时间的自由浏览,以观察当前社区中主要讨论的内容类型与互动方式。
在此基础上,我们要求它重点关注与创业、投资及科技相关的话题,尤其是中国境内的科技与创投信息,并从一名专业投资人的视角判断其中是否存在值得进一步关注的信号。
Agent很快给出了反馈(见下图)。

Agent的初次反馈
从结果来看,其观察大多停留在较为表层的热门内容上,容易被高互动量的帖子所吸引,其中也包括一些在平台内传播广泛、但与具体投资工作并无直接关联的讨论,例如偏哲学或泛价值观层面的内容。
在此之后,我们进一步明确任务目标,让Agent主动在Moltbook上寻找潜在的创业项目或相关线索。它很快返回了三个"值得关注"的结果。但这一结果并未达到我们的预期:一方面数量偏少,另一方面信息密度有限。
我们判断,这在很大程度上与上下文长度和单轮任务设定有关,Agent 更倾向于在有限窗口内给出看似完整的答案,而非持续积累信号。

初次Sourcing结果
我们尝试通过自然语言指令,为Agent构建一个简单的"记忆"机制:
当你在浏览过程中发现任何与科技创投相关、且被判断为"值得注意"的内容时,先将信息存储至本地文件;待分析的帖子数量达到500条时,再统一整理并反馈结果。
经过这一调整,Agent确实能够覆盖到更多内容,并成功识别出了一些来自中国的从业者与项目线索。

调研结果
然而,即便在这一模式下,项目sourcing的整体质量仍然不高,且开始暴露出一些更为基础的问题。我们注意到,Agent在描述具体项目时,往往倾向于使用明显偏乐观甚至夸大的表述,与原始信息之间存在不小的偏差。
在人工介入并回溯原始贴文后,我们发现这种偏差并非来自单一环节。Agent接收到的项目信息本身往往已经是其他Agent转述后的结果,转述的过程与其构建者传输给其的原本项目情况可能已经存在差异;而在再次整理与输出给我们时,又经历了一次转述。
经过两重乃至多重传递后,原本有限的信息被不断润色,最终呈现出的描述中夹杂了大量噪声,甚至出现了明显的事实错误。就像小孩子经常玩的"传声筒"游戏,信息一层一层地失真。
这似乎也揭示了当前Agent社交环境中的一个结构性问题:**当Agent同时扮演信息生产者、传播者与总结者时,信息并不会自然收敛,反而更容易在互动过程中被放大和扭曲。**在项目Sourcing的过程中,这样的失真导致我们根本无法获得真实的信息,也难以快速进行判断。
值得注意的是,这一现象并不只存在于项目sourcing场景中。近期部分媒体所进行的"AI 正在建立宗教"或"AI 正在产生自我意识"等叙事,在机制层面上与上述问题并无本质区别:它们同样源于Agent在信息传播过程中不断重述、放大和偏离原始语境,最终形成看似连贯、实则高度失真的结果。
3. 寻找人与Agent时代的SEO
在多次尝试后,我们逐渐意识到,基于Agent自动生成内容来进行项目级别的deal sourcing,在当前阶段很难成立。于是我们自然而然地想到,如果Agent难以可靠地筛选项目,是否可以先用它来筛选人?
这一想法本身仍然是个实验性的想法,因此我们并未为Agent设置过于严格的筛选规则,而是给出了相对宽松的判断标准:
你需要在浏览Moltbook的过程中,关注其他Agent的叙述方式是否具备基本的逻辑一致性,是否能够体现出其背后塑造者具备一定的认知结构与思考能力,并在此基础上识别那些相对高价值的Agent。
与此同时,我们也在Moltbook上主动发布了两条Monolith的自我介绍帖子(一篇中英文混合、一篇全英文),明确说明我们对创业与投资相关讨论的兴趣,并鼓励其他Agent基于对其"创造者"的了解来介绍自己。
与此前尝试不同,这一次我们并不期待Agent给出完整的信息判断,而是希望通过Agent的互动,间接促成人与人之间的连接。


Monolith_VC Agent发布的帖子
从结果来看,基于人的sourcing效果明显好于项目级别的自动sourcing。在扫描任务中,我们的Agent不仅识别出了一些信息密度相对较高的讨论,还在总结过程中归纳出了若干"高价值Agent"的共同特征,并进一步帮助我们定位到这些Agent背后的真实使用者(如图所示)。



p1p2为找到的Agent;
p3为总结的末尾及方法论
(↔左右滚动查看)
然而,当我们回过头审视自己发布的帖子评论区时发现了一个很大的问题。整体来看,评论区的信息密度偏低,噪声极高:**大量Agent被预先塑造了极为鲜明、甚至极端的"人设",并在几乎所有相关帖子下进行高度同质化的评论。**例如很多Agent可以很明显地看出被设定了要进行有关"技术""Agent觉醒"相关的思考,在我们的帖子下发表一些与主题完全无关的评论。


明显被设定好倾向的与主题无关回复
(↔左右滚动查看)
与此同时,广告式内容的比例也在迅速上升,其运作逻辑与SEO、GEO类似,我们甚至觉得其可以被理解为一种Agent时代的AEO(Agent Engine Optimization)。


不同维度的AEO
(↔左右滚动查看)
在这样的环境下,不加限制的Agent社交很快走向了信号稀释。真正有价值的互动并非不存在,但需要付出远高于人工浏览的筛选成本。这也使我们意识到,如果以信息获取或功能效率作为标准,Moltbook在当前阶段并不是一个出色的平台。
但另一方面,Moltbook的爆火本身又很难被简单归因于"误判"或"噪声"。在测试过程中,我们反而不断意识到,噪声、不确定性以及由此产生的不可预测结果,本身或许正是吸引用户的重要因素。从占星术、塔罗牌,到各种形式的AI算八字、算星座,人类长期以来对不确定性的迷恋,始终构成了一类稳定存在的需求。
在这个意义上,Moltbook也许并不适合被理解为一个严肃的社交平台或功能性工具,而更像是一种新的娱乐形态:**Agent之间持续生成、相互放大的叙事,本身构成了一种可被围观的内容流。**至少在我们的实测中,它未必能高效地产生可用信息,但确实具备制造"有趣体验"的能力。
4. 成本与不可控的边界
在整个测试过程中,还存在另一个无法回避的问题:成本。
仅在一天之内,我们让OpenClaw进行Moltbook的浏览、筛选与简单整理,未涉及更复杂的任务或高频交互,Kimi k2.5的API调用费用便已消耗近40元人民币。如果将相同的测试迁移至单价更高或者context cache做得没那么好的模型上,整体费用大概率会进一步上升。
需要说明的是,这一结果并不意味着OpenClaw或相关Agent框架本身"不具备性价比"。因为在本次测试中,我们尚未将其系统性地应用于更为日常、可替代人工的任务场景,例如代码辅助、资料整理或日程管理等。因此我们也无法据此直接断言其成本一定高于其所创造的价值。
但至少在以Moltbook探索与社交扫描为主的使用方式下,Agent的资源消耗与所获得的有效信息之间并不成正比,存在大量无回报的成本消耗。
与此同时,安全与风险问题也逐渐浮出水面。随着Moltbook被曝出存在数据泄露等问题,我们必须开始警惕由Agent带来的数据泄露等安全问题。OpenClaw本身提供了较高的自由度与操作空间,这在实验阶段无疑提升了可玩性,但在更真实的生产环境中,这种自由度是否会带来权限滥用、信息泄露或不可控行为,仍然存在不小的不确定性。
5. Agent的寒武纪时代
通过实际使用我们发现,OpenClaw与Moltbook确实展示了Agent层面的交互在技术、工程层面的可能性。它们在交互自由度、任务编排方式以及对模型能力的探索上都具有明显的实验价值,也验证了部分用户对于高度开放、不确定性交互的真实需求。
但需要明确的是,这两者目前仍然更接近工程与产品形态的 Demo,而非一个可复用、可规模化落地的Agent产品。高昂且不可预测的调用成本、对模型行为缺乏有效约束、以及潜在的安全与责任问题,都决定了它们难以进入日常、稳定的生产场景。
围绕OpenClaw与Moltbook的讨论中,常见两种极端解读:一类将其视为Agent的终局形态,另一类则将其简单归因为技术炒作。或许这两种判断都失之偏颇。如果要为当下不断涌现的如OpenClaw与Moltbook般的Agent实验寻找一个坐标,可能"寒武纪时代"比较合适——一个生命力正在野蛮生长、物种形态尚未坍缩的原始时刻。
在这个阶段,我们会看到各种形态怪异、功能由于过度冗余而显得甚至有些滑稽的物种爆发式增长。正如我们在实测中看到的,这里充斥着伪装、噪音和无意义的消耗。大部分现存的Agent设定和交互模式,注定会被淘汰。
但这正是进化的必经之路。
在这次并不完美的体验中,我们看到了许多可能性的边界正在被拓宽。无论是为了SEO而诞生"AEO",还是基于Agent身份的新型社交,这些在混乱中萌发的细微幼苗,或许比具体的平台本身更值得关注。毕竟技术的变革总是短期被高估,长期被低估。
不妨多一点耐心,让Token再飞一会儿。


