泡沫里聊干货,我们不小心办了一场“脱口秀” | Attent!on AI 开源夜话

云启资本·2025年8月4日

来自一线的 AI 开源真心话

2025年,脱口秀和开放麦成为备受 AI 创投圈欢迎的交流形式。或许正是因为那些不经修饰、不被PPT淹没的真话,更容易抵达人心。

就在一周多前,我们也无意间把一场 AI 开源夜话办成了脱口秀

7 月 23 日,在云启与开放原子开源基金会联合发布《中国开源发展深度报告》的当晚,我们联合亚马逊云科技和"赛博禅心",在中关村创业大街 AGI Bar 发起了一场 AI 开源夜话。

没有严格的议程,没有预想的共识。30 多位活跃在技术、创业一线的 AI 从业者以轻松幽默的表达碰撞出持续 4 个多小时的高密度交流。在啤酒泡沫里聊了很多干货。

这场夜话也再次印证**,开源的价值,从来不止于技术与代码,更是一种连接人与人的信任机制**。今天我们"开源"部分精华观点,与你分享。

本次开源夜话汇聚了三十余位来自一线的朋友,横跨开源数据库、AI Infra、互联网大厂、开源生态社区等多个方向。

既有如 PingCAP、Zilliz 等深耕十余年的开源"老朋友",也有在思否、开源中国等社区中打磨产品与内容的 Builder;以及来自亚马逊云科技、百度、小米、TikTok、蚂蚁、智谱等大厂一线的技术力量。还有不少连续创业者和拎着外卖和电脑从公司赶过来的 00 后创业者们。

开场分享环节,亚马逊云科技大中华区解决方案研发中心应用科学家何孝霆和参与《中国开源深度发展报告》撰写的云启投资副总裁韦昕分别从业务实践和投资洞察视角,带来关于开源模型落地、开源商业化进展的干货洞察。

跑通开源最后一公里的真问题和真解法

在开源模型百花齐放的当下,真正走到业务一线并实现稳定落地的项目还不多见。亚马逊云科技应用科学家何孝霆以几个故事带我们分享了小模型微调背后的现实场景与思考路径

1. 小模型的"现实主义"选择:笨,但实用

"大模型很强,但客户大多跑不起私有化部署。"这是何孝霆观察到的一个普遍现象。根据他的观察,14B、7B甚至 1.5B 的小模型更容易部署、成本更可控、接受度也更高。一方面,企业无力搭建大规模集群,另一方面,H100 推理成本也让人望而却步。于是,大多数落地方案最后都回到了 L40、L4 甚至边缘设备的现实路径上。

然而,小模型最大的难题也摆在眼前:"笨"。即使微调,也无法拥有大模型那样强的泛化与逻辑能力。在这种背景下,企业只能在"不可能的三角"中做取舍——智力、成本与时延,永远不可能三者兼得。

但这并不妨碍小模型大显身手。何孝霆指出,很多业务问题并不需要模型拥有"解奥数"的能力,只要它"够用"、稳定、泛化能力强,就能创造价值。比如在内容审核、翻译等垂直场景中,小模型完全可以通过微调实现高精度处理,前提是数据喂得好、调得准。

2. 微调不是调模型,是调数据

在这个过程中,微调真正的核心不是技术难度,而是数据结构的质量与解释力。

他分享了一类场景:有互联网需求方希望在用户昵称审核中识别违规风险。客户提供了一批"badcase",看起来非常模糊——有的甚至难以理解如何构成违规。团队发现,单靠这些结果标注无法训练出有效模型,必须让业务侧写出"为什么这条是badcase",并将这种解释过程融入到数据中,模型才能学得准确。

这种数据被他称为**"Thinking数据"**——不仅是标签,而是包含人类思维路径的数据输入。

"我们以前训模型就像教猫坐下,我说'坐下',按它屁股,它真坐下了。后来发现它不是听懂口令,是看到鸡胸肉就坐下。" 这个类比道出了模型训练中最容易忽视的部分:学到了结果,却没学到理由

3. 共建数据、融合业务:真正的"最后一公里"

"现在算力和工具都不再是核心难题 ,真正难的是怎么构建与业务强绑定的好数据。"何孝霆认为,共建数据、融合业务,这是跑通开源真正"最后一公里"的关键所在。 仅以前述违规识别场景为例,不同公司、不同人,对一条内容是否违规的判断都可能不一样。

而数据无法靠爬虫或众包自动生成,只能在技术团队与业务团队深入协作中完成共建。这是技术工程无法"自闭式完成"的任务。而是组织协作与认知共建问题。何孝霆看来,小模型的胜负手,不在于参数多大,而在于能否让"技术与业务共建出一套有效、结构化、解释清晰的数据",只有这样,开源模型才能真正"跑进业务"。

全球化、轻量化、可治理:开源走向产业的三件事

云启投资副总裁韦昕结合新近发布的《中国开源发展深度报告》,从投资视角出发,分享了对当前 AI 技术创业与开源生态演进的观察,也提出了几个尚未被充分讨论的关键问题。

1. 开源创业的破局点:从 ToB 困局走向全球化

中国开源项目很难像海外一样写出完整的"商业化章节"。不是能力不够,而是环境不同:企业用户普遍缺乏为软件付费的习惯,低人力成本催生自研导向。

真正的破局路径是全球化。哪怕暂时无法变现,也可以先从全球社区运营起步,打通使用、反馈、迭代的循环。一旦项目在海外有了开发者基础,客户单价、续费意愿、品牌外溢效应都会显著不同。

不管是做 ToB 工具,还是 ToC 产品,现在的 AI 创业者都应当从 Day 1 就考虑如何"走出去"。全球化不只是销售策略,更是开源生态生存的先决条件。

2. 项目之外,组织也要"开源"——小团队的战斗力来自轻与快

新一轮 AI 创业里,一个明显的变化是组织结构的"轻量化"。模型更新以周计,工具演进日新月异,小团队反而能在高频率变化中迅速转向、快速试错。

年轻、扁平、无历史包袱的团队正在变得更具竞争力。相比大型组织,小团队更容易"掉头"、更敢放弃已有路径,哪怕今天方向有偏差,也能在短时间内纠偏调整。

这种结构上的灵活性,也让它们在开源场景中更具传播效率——一支 10 人团队发布一款 Agent Demo、开源一个数据接口,可能就能迅速引发社区关注,赢得早期势能。

3. 模型之上还有治理:关于开源的几个未解问题

今年年初,以 DeepSeek-R1 为代表,开源大语言模型生态,正在快速接近甚至赶超部分闭源模型。但在视频等多模态等方向,闭源模型仍然保持优势。

真正值得被提起的,是开源背后的治理问题:模型真的"开源"了吗?代码、训练数据、License 是否透明?社区机制如何运行?模型如果被二次包装、甚至"注入风险行为",如何追溯源头?又该由谁负责?

在 AI 时代,开源不只是开源代码,更需要开源"信任"。从代码、到数据、再到使用链条中的安全机制,这些问题没有标准答案,但必须开始被提出。

泡沫里聊干货:那些被"开源"的真心话

开场分享过后,接下来的几小时是属于现场 30 余位 Builder、Thinker、Whisperer 的"开放麦"交流环节。

自由分享交流开始不久,席间的开源中国 CEO 马越"猝不及防"地贡献了一瓶香槟,升腾而起的气泡把现场交流气氛带入又一个热潮

从刚写完代码、临时被 cue 来的大模型公司工程师,到深耕行业十多年经历过全球市场甘苦的IT老兵,再到连续创业者、AI 大厂技术从业者、金融科技 AI 平台建设者、头部开源社区主理人、00 后创业者……

有人复盘自己为何坚定出海,有人给出模型路径与工程实践的实诚判断、有人反思 To B 市场的土壤与周期、有人拆解"开源大模型还是小模型"的行业现实,还有更多人结识了新朋友、建立了新连接。

最后我们以不具名的形式,开源部分大家留下的金句,也期待能有更多这样的夜晚,激荡出更多思想火花。

开源社区负责人 海内外十余年经验

ToC 跑得比 ToB 快六倍,但ToB 别着急,等 ToC 把范式跑明白了再拉回来。

大模型开源,不是为了大家真去用,而是为了证明:我真的能训。

大模型创业公司一线从业者

开源分布式数据库资深管理者

AI 是互联网原教旨主义的延伸,开源+云+AI,带来最大程度的自由。

技术人改变世界的初心不能丢,但活着本身就是胜利。

从业十余年IT老兵

AI数据创业者

如果行业竞争主要聚焦于价格战和服务战,

而非技术战。长期来说,这样的环境下诞生伟大的产品与技术。

希望这个时代能让开发者自由工作,有更多say no 的权利。

AI infra平台

创业者

互联网大厂

AI应用开发

开源不是复制答案,而是帮我们看到一条路径真的能 work。

起初认为开发 AI 应用更多的是在于构建,但其实更多在于发现"应用与用户的连接",并且把这一部分传递给模型。