三个从港大走出的 90 后博士生,要让未来每个移动机器人都有海马体|Z Talk

真格基金·2025年6月10日

如何跨越实验室到产业的「死亡谷」,打造机器人的「奥丁之眼」?

留形科技团队相识之地位于港大最古老建筑之一,薄扶林道旁黃克兢樓的地下室。秦佑铭和徐威刚来港大读博时,MaRS Lab 还是一个蒸汽锅炉房。因为锅炉房体积大、挑高特别高,正好适合无人机的飞行试验。从不见天日的地下室,到清新地的海滩,秦佑铭和徐威天天都在与同门一起测试算法,「炸无人机」。

在港大读博期间,他们也见证了 MaRS Lab 从一个陈旧的地下室变成了学术界顶尖的无人机实验室。实验室的 FAST-LIO 开源项目在 GitHub 星标达到了 3.3k,是近年来机器人定位与地图构建(SLAM)领域最具影响力的开源系统之一。FAST-LIO 推动了机器人从「离线建图」到「在线理解空间」的转变。多年在感知领域的积累与炸机的痛,让秦佑铭和徐威想降低整个机器人社群使用这项技术的门槛。

2022 年底,秦佑铭和徐威博士从 MaRS Lab 毕业,此前共同创立了留形科技,致力于为通用具身智能提供最关键的感知能力。90% 的科技成果止步于实验室,而留形是少数的幸存者之一。第一代产品 MindPalace 360 上线三个月就实现了盈利。同年,真格基金种子轮投资留形科技。

刚刚发布的第三代传感器 Odin1,被创始团队称作机器人的「海马体」。Odin1 为机器人补上了感知系统中最关键的一块——空间记忆。Odin1 装了个小 NPU,能处理图像语义、做物体识别、空间构图、实时更新和共享记忆系统。

如果说算力充沛的大模型是机器人的「大脑」、精准执行的控制系统是「小脑」,那么 Odin1 就是「海马体」。

传感器的 iPhone 时刻

驱动三维感知与自主决策

Q:请三位先简单介绍一下自己。

秦佑铭: 我叫秦佑铭,留形科技 CEO。本科在弗吉尼亚理工读电子工程,后来在香港大学和张富老师一起做无人机方向研究。读博期间认识了我们的合伙人徐威。2021 年 10 月,也就是毕业前,我们在香港创办了留形 Manifold Tech。

徐威: 我叫徐威,是留形的 CTO。我的本硕在北航,博士跟佑铭是同一个老师,前后脚毕业。我研究的是三维建图和定位,主要偏算法侧。留形现在也主要做三维感知,提供机器人定位导航解决方案。

杨帆: 我叫杨帆,担任 COO。背景跟他们两个有点不一样,我本科在港大读机械工程,和佑铭是「跨时空」舍友,后来去 UIUC 读了航空航天博士。这是我第三次加入真格投的初创公司,之前也做过机器人方向的工作,现在主要负责公司整体运营、海外市场和品牌传播。

徐威(左)、杨帆(中)、秦佑铭(右)

Q:留形从 2021 年成立至今已经发布了几代产品,从最初的三维数据采集设备到 Pocket 等等。你们如何看待 Odin1 在整个产品线中的定位?如果用一句话来总结它的特点,会怎么说?

秦佑铭: 和前两代相比,Odin1 最大的变化是它更小巧紧凑,真正做到了开箱即用。以前的设备还像是「大哥大」,而 Odin1 更像一部智能手机。可以说,它终于迎来了自己的 iPhone 时刻。

如果用一句话来定位 Odin1 :它是世界上第一款具备空间记忆能力的传感器。

这个「空间记忆」有两层意思。第一是感知空间:能知道周围有什么东西、它们是什么形状、在什么位置。就像福尔摩斯破案时,闭上眼就能重现案发现场的三维画面,把散落的线索拼起来。我们上一代产品叫 MindPalace,也是这个意思。

第二层是理解空间:不仅「看见」物体,还能理解它们的意义。比如识别出桌上有个麦克风,并意识到我正在对着它讲话;又比如看到你电脑边有瓶水,它会判断这瓶水可能对电脑有风险。

这其实就是我们常说的「眼力见儿」。 等到具身智能真正普及,我们肯定不希望机器人还在原地发问,「你要我转几度?」「哪个东西要递?」,而是能听懂话里的空间语义,比如「去隔壁帮我倒杯水」,它能自动理解要找水杯、找门、选路径,然后把事办了。这背后就需要空间记忆。

徐威: 空间记忆意味着机器人可以记住它曾到达的所有位置与姿态。就像我们人在陌生场所会下意识记住路标、绘制脑海中的空间地图,我们的传感器也可以。

空间记忆在过去很多机器人系统的需求中反复出现。只是以前解决这个问题的综合成本太高,手段也有限。我们希望把这种能力和上游日益成熟的传感器与边缘计算能力结合,集成到一个小巧、可用的模组里,适配各种机器人。

Odin1 是我们目前最小巧、配置最先进的一代产品。 无论是 LiDAR、相机、还是 CPU,都是自研定制的,完成了高度集成。

杨帆: 对用户来讲,Odin1 的意义在于,它让机器人第一次真正抛开了遥控器,在室内复杂的空间中自主感知、决策和移动。空间感知是自然界普遍存在的能力,几乎所有生物都有,很多团队也都在尝试复现,但无一真正落地。而 Odin1,希望就是那个拐点。

Q:你们是什么时候意识到空间记忆这个方向可以作为切入点的?

徐威:空间记忆的需求一直都在。 变化出现在过去一年。整个上游链条因为自动驾驶的发展慢慢成熟,供应链的组建更丰富、标准化,芯片性能也随之提升。我们在去年年底意识到这个点可以做,就立刻投入了。

这背后有两个产业趋势在推动我们:

一是传感器正朝着降本和固态化方向演进。 比如金光、韵达等企业都在往这个方向推。等到成本打下来,传感器就会像今天的摄像头一样普及。

**二是嵌入式 CPU 的升级。**2023 年开始,不管是英伟达还是国产厂商,都开始推出性能很强的嵌入式 CPU 和 MPU。这为我们做集成、小型化提供了可能。

我们也有一个积累优势,是过去几年在科研中沉淀下来的算法能力可以快速部署到硬件上。这不是谁都能轻松复刻,因为中间涉及大量的软硬件协同开发。我们团队在这方面的反应速度是一大优势。

Q:你们三代产品是如何演进的?

秦佑铭: 我们很早就规划了 Odin1。就像特斯拉先做 Model S,才做 Model 3,我们也想着先做高端,再做小型化普及。团队经验可以沿用,节奏也更快。

第一代是 MindPalace 360,两个矿泉水瓶那么大,2023 年 2 月发布。那时我们刚完成一个项目,用它扫描了周星驰电影《食神》里的海上餐厅太白海鲜舫。

全球就两艘海上餐厅,一艘叫珍宝,一艘叫太白。我们创业那年,两艘船都进入了「中年危机」,急需维修。结果珍宝沉了,太白意识到得赶紧留个完整记录,于是找到了我们。

2023 年,留形团队于太白海鲜坊进行文物复刻作业

但在船上拍摄并不容易,倾斜摄影用不上,GPS 也没信号。我们自研的第一代留形机第一次派上了用场。刚修好没多久,香港来了一场台风,顶层修缮时就用到了我们采的数据。

那时觉得,光核心部件就这么大,要是再加屏幕,整体体积得接近中画幅相机。但没想到越做越小。第二代 MindPalace Pocket 已经能揣进兜里了,只有拳头大小。

到第三代 Odin1,就完全进入手机形态了。我们希望它以后能成为科研标配,就像博士入学第一件事是买主控板,而这块板子上默认的传感器,就是 Odin1。

为什么「小」这么重要呢?**对我们这种有无人机背景的人来说,每多一克、少一克,都会影响推重比,决定飞不飞得起来,能不能续航。**比如说,大疆经纬无人机空载能飞一小时,一加负载就只能飞二三十分钟。轻量化是刚需。

Q:你们其实从第一天起就已经想清楚了 Odin1 的终极形态?

秦佑铭: 是的。如果你翻翻我们 2021 年发在 B 站的视频,会看到当时用一台 iPhone 拍的幕后花絮。那时我们脑子里已经在想第三代、第四代的模样了,渲染图就是按照那个方向去画的。

我们把它称作「空间相机」。想象它像一台单反,只不过拍下的不是二维照片,而是完整的三维场景。因为如果未来 VR 或 MR 真成了主流,我们就需要一台能记录「空间」的相机。

视频里有个镜头,是一个人从兜里掏出一个像手机大小的设备,然后环境瞬间被三维捕捉,变成了一个可以自由穿梭的游戏场景。我们最终的愿景就是:打通虚拟与现实的边界,让两个世界无缝连接。

2021 年底,留形在 B 站发布的 MindPalace 视频节选

所以我们在 2022 年提出了新的 Slogan:「Bridge the gap between virtual and reality」。

想想 1970 年代,人类发明了二维打印机;几十年后,又出现了 3D 打印机,能直接打印一架无人机。我们本来就生活在三维世界里,为什么还要用二维的工具去表达和生产?

比如说,你手上有一套房子的三维原始数据,就可以直接用 AI 自动生成装修方案,然后交给工厂定制生产。这时候,空间不再只是「看得见」,而是「能用起来」。

对机器人来说也一样。今天的大模型给出的答案,本质上是文本,是一维的,甚至连真正的二维可视化都谈不上。那是一种线性思维。但一旦我们能拥有三维层级的理解和表达,虚拟和现实才算真正接上了。

我觉得,「空间记忆」不是对已有世界的解构,而是一种开体,把万物纳入空间智能的可能性中。 任何东西都可以在空间中被理解、被交互,它打开的是一个全新的维度,带来的想象空间才刚刚开始。

徐威: Odin1 和前代产品保持了很强的连续性。许多二代产品的客户对新一代都非常激动,因为对他们来说,Odin1 带来了实质性的提升——体积更小、成本更低,尤其是成本控制表现出色,让他们能够以更高效的方式采集三维数据。

每小一厘米、低一分成本

都是与现实的博弈

Q:针对机器人这个主要场景,你们做了哪些应用层的优化?

秦佑铭: 重量、体积、价格,鲁棒性、稳定性,这是我们设计一个机器人系统时最关心的几个维度。Odin1 是体积小巧,但每减少一厘米,背后都牵动着底层传感器的优化。我们不仅要考虑硬件参数,还要在软件层面做好适配。

我们的目标是让 Odin1 能成为很多小团队的「第一台空间感知系统」——**开箱即用,快速跑通,从遥控汽车直接迈向具身智能。**我们重新设计了 Odin1 的「Hello World」,就是希望能降低门槛。

徐威: 之前机器人上用的很多传感器原本是为人类视觉设计的,有体积很大的模组或航空插头,对机器人来说太不友好。我们这一代直接用了 Type-C 接口,外形尺寸也和很多双目相机保持一致,直接贴合「眼睛」,方便用户平滑替换旧系统。

秦佑铭: 我自己读博期间也搭过很多系统,每一篇论文就像做一个新产品,每次都要重头搭平台。很多无人机都是自己炸出来的。

吃了无数亏我才明白,有些基础系统的重复劳动,不值得每一代研究者再从头再来。Odin1 就是为了解决这个问题,我们希望别人能直接站在我们搭好的系统上,把精力花在真正的革命上。

留形团队于 2019 年博士在读期间合影 徐威(左一)、秦佑铭(右三)

Q:你们有做过什么艰难的取舍吗?

徐威: 几乎每一个参数都要权衡。一开始的重量目标是 200 克,最后只能做到 299 克。每一个尺寸、每一个接口,背后都需要大量验证,都是在「戴着镣铐跳舞」。我们尽可能去找到一个性能、成本和可制造性之间的最优解。

Q:你们曾提到,机器人的「海马体」出现需要某些前提,那么当前的技术瓶颈是什么?

徐威: 短期技术瓶颈是存在的,但总会解决。真正难的是如何将产品有效推向市场。

我们第一代设备的售价大概在 7-8 万元,而且还是多个传感器零件组装为一个设备的形式,当时无法把机器人的「海马体」集成为一个紧凑的模组。但在我们这一代的产品——机器人的「海马体」Odin1 上,我们在成本及结构上做了很深的打磨,能够把所有的部件完美集成为一个模组,同时把价格降到可以在机器人领域大规模应用的的区间。

杨帆: 成本控制是关键因素之一。机器人设计中最常用、也最基础的传感器就是相机。从趋势看,所有机器人传感器都应当向相机学习,向着低体积、低功耗、高集成方向演化。

对初创公司而言,越过死亡曲线,需要同时做到两点:价格进入合理区间,并快速投放市场,跑出出货量。 只有在量上来后,成本才会降,进入规模化。技术要先进,更要能商业落地。

每个移动机器人都需要一个海马体

Q:目前我们看到机器人和具身智能体的快速发展,大脑功能(大模型、世界模型等)快速发展层出不穷,小脑(运动控制、强化学习算法)也在持续进化,但海马体的能力仍显不足。海马体为什么对机器人是重要的?

徐威: 让机器人完成复杂任务,光靠跳舞、倒咖啡还远远不够。真正的挑战,是让它能自主串联起多个任务,从一个房间到另一个房间,连续完成不同目标。

这正是我们今天讨论的 Physical AI,让机器人学会如何与物理世界交互。 眼下虽有大量 Demo,但落地还是很难。尤其在任务复杂时,能否稳定地将任务拆解、串联、执行,是一个巨大挑战。

好消息是,机器人的感知能力是可以大幅提升的。一方面,先进传感器和前融合算法能拓展机器人的感知边界;另一方面,我们也能在终端用更低成本,实现对空间的细致识别与记忆。

一旦机器人有了空间记忆地图,就能把复杂任务切分为一系列可执行的子任务,有序完成。这种底层能力是稳定性和三维感知跃升的基础。

杨帆: 我们可以从实际应用场景看几个例子。

「大脑」靠大模型理解指令和环境,「小脑」控制动作输出,那「海马体」承担的能力是什么?

它不是让机器人取代人类,而是完成人类难以胜任、甚至危险的任务。比如我们接到过反馈,用户希望机器人能在消防现场代替消防员进入高危区域检查。但目前的机器人仍依赖遥控操作,到不了独立执行任务。

最近地震频发,救援现场的视频能看到,机器人仍然是通过有线遥控钻入狭小空间探索。未来,它能否自主探索废墟,第一时间传回关键信息?前提是它得知道自己在哪儿且理解周围是什么。

这就是「海马体」的作用。在人脑中,它处理空间记忆和认知,而机器人尚未拥有。李飞飞当年提出「空间智能」的概念也是基于这个观察。

虽然 2D 领域的视频理解、内容生成已非常成熟,但机器人与三维物理空间的交互能力仍然受限。很多人会误以为导航定位已经解决了这个问题。没错,户外导航确实非常精准,比如高德地图。但复杂的室内环境呢?

目前主流 City-level 定位技术主要面向室外。要让机器人真正理解、记忆、适应复杂多变的室内环境,还有很长的路要走。

秦佑铭: Odin1 本质上是一种「空间翻译器」。

没有它之前,机器人只能照着程序执行固定动作。但如果拉长时间线,比如未来它们要在火星上生活,我们不可能还从地球发指令过去。信号延迟那么久,它必须学会根据环境自主应变。你已经是个成熟的机器人了,要自己做判断,才能给人类省心嘛。

Odin1 作为空间翻译器,意义重大。它让大模型不再只处理文字,而是真正理解空间,并将推理能力延伸到物理世界。

我们看到一个数据,人类 70% 以上的时间生活在室内,GPS 信号覆盖很少。 在这种环境下,如果机器人不能自我定位、导航、理解空间,它就无法真正进入我们的日常生活。

2023 年 3 月 12 日,留形小试牛刀,参与香港历史博物馆翻修进度管理

杨帆: 大家可能记得,2020 年起,酒店送餐机器人开始普及,可以把外卖从前台送到客房门口。但这是非常初级的室内导航应用。假如用户希望机器人多做一步,帮忙收走门口垃圾,只要走廊环境发生微小变化,比如新放置障碍物,系统就会失效。

我们希望开发的系统,不依赖静态地图,而能在真实环境中持续成长、自主适应,实现更高层次的空间智能。

Q:在空间感知能力尚未完善的今天,有哪些是你们深信不疑、非共识但正确的观点?

杨帆: 空间导航本身就没有形成统一共识。尤其在自动驾驶影响下,越来越多人开始探讨「端到端」的极限——我们是否真的需要完全端到端?是否有更优的混合路径?

秦佑铭: 端到端一度被「神化」过。有人认为,只要数据足够,端到端模型就能解决所有问题。但现实远比这复杂。

Odin1 就体现了我们的路径选择:我们既采用学习驱动的感知能力,也保留纯数学模型,在导航层面做精准建模。这是对空间智能的双轨设计。

徐威: 现在谈 AI,大家往往忽视了「记忆」。

大模型的所谓「记忆」其实只是一次性的信息容纳和输出,内部并没有清晰的记忆单元。但对生物来说,记忆显然是核心。

想象一下,如果机器人能在多体之间共享记忆,在团队协作中循环优化,它们的学习效率将大大提高。换句话说,我们不希望记忆消散在每一个孤立模型中,而是实现可共享、可更新、可演化。

谷歌也在尝试这条路径,比如把记忆模块从神经网络中剥离出来,作为独立子系统存储。要看机器人第一次进入一个新工厂、新空间,能否在感知的同时,将空间结构与任务流程绑定在「记忆体」中,与其他智能体共享。

最终,我们希望实现这样一种体验:就像《黑客帝国》中的「虚拟空间」,一个机器人感知并建构的环境,不仅自己可用,还能为所有系统提供可视化、交互式的记忆接口。

关联记忆不仅是机器人智能的重要部分,也可能是它们区别于人类、甚至在某些方面超越人类的关键。一些能力并不需要模仿人类,反而可以走出自己的路,表现得更好。

杨帆: 徐博讲得很有趣。如今判断一个大模型强不强,很多时候是看它离人类错误率还有多远。但在机器感知领域,这个标准未必适用。像 Odin1,它能精准获取每一个像素的深度信息,比我们人类的能力要强。

徐威: 人类是碳基生物的自然进化结果。并不是轮子比腿更高效,人类就会长出轮子。哪怕轮子的性能远超双腿,它也不会自动改变我们原有的生活方式。

传感器也是如此。幸运的是,我们已经发展出了比人体更强的感知装置。问题是,我们要不要继续陷在「机器人就该像人类」的路径依赖中?我认为这是种误区。我们应该充分释放现代传感器的潜力,而不是执着于模仿人类形态。

Q:你们怎么看空间记忆对机器人的意义?它是一个渐进性任务最终实现的高阶模块,还是可以和「大脑」「小脑」同步开发的?

徐威: 应该是并行的。因为自然界就是这么演化的。

小鼠的海马体里有「位置细胞」,能对环境中某些区域形成特定反应。这说明哪怕低智能生物也具备空间记忆系统。

人类方向感的强弱也和海马体结构密切相关。意味着,大脑在发育过程中,不是一个模块先另一个后,而是多个功能并行成长。

所以我认为,具备移动能力的机器人未来一定会有空间记忆系统。否则它很难真正理解复杂环境。当然,固定在桌面上做重复动作的机器人可以例外。

杨帆: 目前大多数人形机器人着重做小脑,而作为大脑的大模型也发展飞快。但如果没有记忆,尤其是空间记忆,移动机器人的意义就很难成立。

机器人要能移动,就必须理解空间。 Odin1 装了个小 NPU,能处理图像语义,做物体识别和空间构图。而且记忆系统是可以实时更新和共享的。

当我走进一个房间,看到五个人,我不只是看到障碍物,还能识别出「谁是这屋子的人」「谁是陌生人」。扫地机器人就很难做到这一点。它看到的,只是该绕过的「东西」。

而空间记忆能让机器人知道,这个区域上次有一排箱子,这次进来箱子没了,说明这里现在可以走。这和我们进屋发现桌子换了地方、路径就跟着调整的过程几乎一样。

秦佑铭: 不仅是记忆刷新,每个体的地图还可以共享。你可以类比 Wiz 这类导航软件,你发现堵车可以上报,系统再通过大家的车速判断路况。

未来的机器人也可以这样工作。A 机器人发现路坏了,更新地图,提醒所有其他机器人别走这条路;甚至同步给道路维修机器人,派队处理。这是效率最优的形态。

就像现在我们用导航,哪里堵车大家就避开一样,有数据、有感知、有分享能力的机器人,最终一定也能做到这种群体协作。

Q:FAST-LIO 作为底层技术的价值上次也聊过很多,能不能再讲讲你们是怎么从实验室技术往产业场景切的?从找到第一个建筑测绘场景到今天,对应用场景的理解有没有新的变化?

秦佑铭: 我们最初的 MVP 落在香港,客户是建筑行业。最直接的机会来自本地,且香港本身高度重视数字建筑化。与其说我们去找,不如说是用户找到了我们,帮助我们定义了第一代产品。

我们很早就确定了做空间感知。但第一代产品落地,选择了最现实、最迫切的场景。随着市场拓展,我们接触到了林业巡检、基建测绘等需求,第二代产品就开始往通用化方向迭代。到了第三代,我们进一步优化模块结构,软件可复用,硬件极致降本,在性能和成本之间找到平衡。

这一品三代背后是我们始终坚持的一个原则:用高精度、低成本、高效率的数据采集系统,去连接现实场景的复杂需求。

徐威: 从第一代开始,我们就聚焦在高效率、高质量的 3D 数据采集。建筑、消防、测绘等场景都在用我们的产品做快速建图,支持一线人员作业。整个产品技术栈也在不断拓展,现在已经远超我们最初实验室的设想,成了一个真正意义上的系统性平台。

2023 年 6 月,留形在河南金矿的早期实地测试案例

Q:除了建筑和家装,3D 数据还有哪些被低估的场景?

秦佑铭: 比如最近爆火的《黑神话:悟空》,用实景三维还原历史文化遗址,通过高斯渲染做到了毫米级精度。很多玩家甚至不是在打怪,而是在「云旅游」。

三维建模技术如今已大量用在影视游戏中,不论是纪录片、剧集背景,还是全片段绿幕虚拟拍摄,都靠空间重建能力。像 Unity 和 UE 的生态都已经接入这类功能。

杨帆: 在我看来,机器人发展中最缺的就是高质量的实景三维数据,也就是学术上常说的「real-to-sim」问题——如何快速把真实空间还原到虚拟仿真环境中。

为什么要做这件事?因为大部分机器人训练都发生在模拟环境里。没有一个贴近真实应用场景的虚拟空间,机器人就很难「学得好」,更别说具备真正智能的行为能力。

相比之下,图像数据的训练已经成熟得多,毕竟互联网上有海量照片可以用。但高质量三维空间的数据几乎找不到。比如我要训练一个机器人在我家中执行任务,但我家里的环境在网上根本找不到。

我们需要一种简单、快速、低成本的方法来采集这些三维环境,并构建模拟空间。

越过从实验室到产业的「死亡谷」

Q:无论是 AI 还是具身智能,技术走向产业都绕不开「死亡谷」。据说 90% 的实验室成果止步于工程化,真正落地的更是少数。留形起步于港大 MaRS Lab,是如何跨过「死亡谷」的?

秦佑铭: 其实我们自己也没想到走了这么远。团队里不少人做过机器人比赛,也有人连续创业。看问题不会太理想化,同时又有很强的工程落地能力。我们和用户之间的距离相对更近,常有人说我们是「非典型工程师团队」。

所谓死亡谷,很多时候是因为做技术的人离真实用户太远了,在想象中走得太远。留形没有着急扩张,而是不断打磨技术,和用户一起反复验证产品。在前几年金融环境高度不确定的情况下,能活下来、活得还不错,很大程度上也因为这一点。

徐威: 对公司来说,最核心的事情是为客户创造真实的价值。不是做一个理论上看起来很厉害的产品,而是真正解决客户的实际问题。如果技术不能帮助客户,那它的价值就大打折扣。

很多创业者没看清问题的本质,而是在构建一个并不存在的需求,这在学术界尤其常见。大量论文提出的假设本身就没有意义,因为它们解决的,是一些虚构的问题。

杨帆: 我从之前的创业经验中深刻体会到,你如果不尊重市场,就一定会被市场教育。

我们团队内部常问自己两个问题。第一,我们有没有提供客户真正需要的价值?尤其是 ToB 客户,他们对应用场景的理解直接影响我们怎么设计产品。我们经常会跟客户复盘,理解他们对参数、性能的具体需求。

第二,客户愿不愿意为这套方案付费?只有客户愿意掏钱,这个产品的价值才是真实的。如果没人愿意买,说明它在这个行业里没有足够的意义。

秦佑铭: 我举一个小例子。有一家我们认识的香港公司,只有两个人,创始人是个印度人。他们解决的问题非常具体:在海底 20 米深的实验室,24 小时监测有没有鱼咬珊瑚。听起来简单,但因为找对了用户,这家公司就活了下来。

我也知道另一个失败了的公司。他们一直专注于改进自己的传感器技术,过度关注参数的提升,却忽略了客户真正的需求。说到底,客户可能只关心鱼咬了多少次,而不是监测的灵敏度到了多少位。

客户买的是解决方案,是能长期运行、持续产生价值的系统,不是技术本身。技术再复杂,不能真正对症,也很难走得远。

杨帆: 产品化和学术研究最大的差别,就是一致性。论文里说某个技术提升了多少倍,很多是在实验室的特定条件下实现的。论文可以成功一次就够,但产品不行。

真正的产品必须在成千上万次使用中保持可靠,不能出错。很多性能上的极致设计,可能在应用中根本跑不稳,客户信不过,就陷入无尽的售后问题中。

我们不太喜欢去炫产品,而是更务实地打磨它,确保能稳定运行。尤其我们面对的很多场景环境都很复杂,如果产品扛不住,就不是团队不努力的问题,而是选错了路。

Q:外界说你们产品上线三个月就实现了盈利,是真的吗?

秦佑铭: 我们还没正式成立公司时,就有客户找我们、催我们赶紧注册,因为他们真的需要这套产品。

从第一次接触客户,到产品真正落地,中间其实走了很长一条路。我们的节奏比较稳,更多是在打磨,没有一个说从箱子里拿出一瓶酒就爆火的神话。这种故事往往掩盖了很多背后的努力。

Odin1 的很多产品定义都是我们和客户一起讨论、打磨出来的。我印象特别深,早年我打 RoboMaster 时,一位队长曾描述了一个系统,后来和 Odin1 的形态几乎一模一样。那时 Odin1 才刚刚立项几个月。

我一度很惊慌,以为是不是有什么信息泄露了,后来才意识到,其实很多真正的痛点,行业里的人早有共识。从第一性原理出发,Odin1 是自然收敛出来的最优解。

我们和 RoboMaster 渊源很深。我做过 RoboMaster 解说,第一份工作也是在大疆,后来还在美国组建了战队。每年比赛,坑几乎是一样的,但年年有人踩,因为队员在不断换代。

搭一套系统,可能要花一年培养新人,刚培养好人就毕业了。所以你去看很多学校队伍,技术是断代的,在不断重走老路。我们要解决的就是这些长期存在的痛点。

2023 年 3 月,留形在深圳设立研发部,推出初代机型

徐威: 我见过不少队伍,新人一来就被分配做底层工作,比如标定、同步、选型。这活琐碎、累,干一段就想换项目,最后做这块的往往是队里技术一般的同学。

但也有例外。我印象深的,是一支传承特别好的队伍。他们有个「老师傅」,大六还没毕业(笑),一直在队里坚持做这块工作。他没把经验写成教材,但因为他在,这支队伍技术就没断过。

杨帆: 我们早期客户很多就是这些小团队。他们的痛点特别明确。搭感知系统这件事不是一个人能做的,要几个人协作、调试、磨合,有时候要好几个月甚至一年。而我们的系统到他们手里后,立刻就能让他们的机器人「活」过来。

Q:你们的护城河是什么?

杨帆: 制造业最终比的是综合性能。整个产品从开发打样到量产,周期可能要一年,我们的优势在于把每个环节都打磨得更好。

这和 C 端快速试错的节奏不一样。制造业不是穿山甲,不可能飞快地一轮轮迭代。

比如英特尔的双目视觉系统,市场上很多模仿者,最后也只能做出性能更差、价格更低的版本。像索尼的 CMOS,大家都在学,但只要预算足,最后大家还是会选索尼,选最好的那家。

像我们第二代的产品 Pocket,现在如果你搜索「手持三维扫描仪」,大概可以找到十几款产品,甚至还有一些在 Kickstarter 上以 1699 美元八折出售的。

这也侧面印证了我们赛道的选择是对的。如果这个方向没有意义,没有真正的市场需求,大家也不会蜂拥而至效仿。

秦佑铭: 正如那句话所说:「Imitation is the sincerest form of flattery.」(模仿是最真诚的赞美。)

这其实是初创公司经常遇到的一种悖论:**如果你做的事情没人模仿,那反而要反思自己是否走对了路。**但一旦你真的盈利了,尤其是在中国这样生产力高度充沛的环境下,你回头一看,就会发现一大批竞争者已经蜂拥而至了。

徐威: 制造业里面没有真正的护城河,只有快速、高性价比的产品。

杨帆: 这还是个长期主义吧。

秦佑铭: 对,这一定是前提,否则很容易陷入恶性竞争,只是比谁更便宜、谁出货更快了。

但我们在做的其实是一整套生态,核心是一个可以给机器人训练用的仿真系统,能尽可能还原一线作业的真实场景。

如果这套系统能真正跑在实际环境里,它会是我们未来一到两年内最关键的战略方向之一。我们可以通过已有客户的使用不断积累真实数据,再反过来优化生成的虚拟数据,最终让我们的 3D 数据服务体系更完整。

说到底,用户是我们最大的护城河。

Q:也就是说,产品开发是从理解需求开始?

秦佑铭: 没错。比如在机器人场景下,刷新率的高低可能直接决定飞行设备是否会炸机。而如果一个传感器对主控算力的消耗过高,就需要外挂处理器,进而要加装散热装置。空间不足还会牵一发而动全身,带来一系列问题。

我们的产品之所以能落地,也是因为我们在内部大量自测。每一个参数的打磨,都是为了解决一个真实存在的系统性问题。

Q:算法技术是你们最重要的核心能力。

秦佑铭: 留形最开始的壁垒是算法。我们的技术发展也一直在往上游拓展,很多硬件都是为了支持算法的设计去做定制。但现在,我感觉技术上的优势不仅是算法本身,而是软硬件的同步。二者融合能成为一套最优的系统。

这套技术本身就是一个系统工程。就像我们以前做学术研究或比赛,尤其是在 MaRS Lab 时,每篇文章都像是一个产品的迭代,帮助我们逐渐培养了用户思维。

在机器人行业,你要想采数据和做实验,至少得有一个验证平台,且最好是专门为实验设计的。医疗行业可能通过医院或实验室就能获取数据,但我们要基于数据跑一些模型,是一个系统性的行业问题。

徐威: 确实,机器人的硬件开发团队效率会更低,因为他们需要大量资金和时间来开发真正的系统。问题不单是通过软件或算法就能解决的,而是涉及整个系统工程。

做我们这种系统复杂度高的产品,每个螺丝钉松了都可能有问题。硬件产品本身的特殊性也是周期长,不像软件那样按周更新,可能是以月,甚至以半年为单位的速度,所以我们可能会有一个相对较长的领先期。

创业不是命题作文,是一场光荣的进化

Q:聊聊创业的动机吧。从港大毕业后,你们其实也可以选择去大疆、华为这样的平台工作,当初为什么决定要创业,做一家公司?是在读书时就已经想清楚了吗?

秦佑铭: 大疆的工程师氛围非常浓,我很尊重它的企业文化,也是在那里养成了很多做事的习惯。不过,大疆的主线是一家飞行摄影公司。

我们在做机器人和无人系统相关的科研时逐渐意识到,**一个真正好用的无人系统,必须具备「眼色」,也就是对空间环境的清晰感知能力。**它需要知道自己在哪儿、环境发生了什么变化、该如何应对。而这个「眼色」恰恰是无人机普及最关键、却也是最缺失的环节。所以在确定方向时,我们毫不犹豫地选择了空间智能。

我自己从小就喜欢动手做东西,博士选题也正好是机器人相关,跟张老师的研究方向契合。他也是最早鼓励我们创业的人。

港大本身对创业非常宽容。 博士阶段我们可以在一个学期修完所有课程,学校也采用 Pass/Fail 打分,减少了内卷压力。这让我们有时间去接触真实客户、推进科研商业化,逐步建立用户视角,理解技术背后的商业逻辑。

2021 年 10 月 27 日,梦开始的地方,留形注册于李国贤堂 709 宿舍

徐威: 很多人以为创业就是跳出系统,其实不一定。很多师兄去了大公司,最后也要组团队、跑上下游、路演、拿资源——这些和创业没太大区别。而且在体系内你的命题往往是被设定好的,自由度反而没那么高。

无论是在公司还是在学校,你的方向、资源、节奏,受控因素非常多。虽然稳定、安全,但实际能施展的空间和真正创业是不同的。

秦佑铭: 选择创业还是去大公司,有时候中间就差一个真格。

我们那时候刚发完几篇机器人方向的顶会论文,真格像星探一样发来邮件,我们也因此有了第一次接触。他们一直鼓励我们去走这条路。

在大公司,如果你拿了它的资源,你就得做它的方向。一件事情,可能有好几个团队在同时做,最后择优。这跟初创公司的竞争本质上没有区别。

而且你做的事情可能是很边缘的,比如要去用七八年前的开源视觉算法套过来实现自动识别「鱼咬珊瑚咬了几下」。我们更想去解决一个我们在工作中亲身碰到的问题:空间智能领域还没有一个好用的传感器。每年都有大量机器人从业者被同样的问题卡住,我们不如就自己把它做出来。

真格给我们提供了第一笔资金。他们的出发点是,**如果机器人行业要发展,整个产业链就得跟上。而不是去追某个竞品,或者达成一个具体的业绩目标。**资金来源不同,最终走出的路也完全不一样。

Q:创业以后,有什么和预期不一样的地方吗?有没有想过,如果没创业,现在会是什么状态?

徐威: 时间是单向的,做假设没有意义。更重要的是,当下的所得是不是所愿。

杨帆: 各个行业都是围城,创业也是如此。我的三次创业经历都和想象中的不一样,就像人生一样难以预设。过去我们以为创业有一套标准剧本:出国、回国、创业、上市。但从 2020 年开始,世界突然发生了变化,我们这一代人很多时候甚至都无法理解当下到底发生了什么,也无法按照过去经验预测未来会发生什么。

我不认为创业适合所有人,但它确实打开了我对自己的认知。每一次创业,我都发现自己能胜任很多没想过的角色,甚至喜欢上了原本不熟悉的工作。我不是一个相信「稳定性」概念的人,相比在大厂按部就班,我更愿意去承担不确定性所带来的创造空间。哪怕有失败,比如我上一段创业也亏了不少钱,但正是这些让我明白,自己不是只能读书,而是觉得无论被丢到哪个国家、行业、岗位,我都可以把事情做好。

Q:如果你们要招人,为什么来留形工作是一个令人心动的 Offer?

杨帆: 量化来看,加入留形可能比你去读一个硕士甚至博士收获更多。不论是人数还是营收,这两年我们的增长速度非常快,基本是指数级的,每年增长三倍。现在就是加入的最好窗口。

秦佑铭: 我们目前最紧缺的是算法相关岗位,特别是在建图和定位方面。这是全球都在攻坚的方向,真正能做出来的公司非常少,我们是其中之一。

徐博以前拿过世界级算法竞赛的冠军,现在仍然在做一线技术指导。能跟他一起讨论问题、一起动手开发,是技术研发者难得的机会。

我们想在机器人发展的这条路上,贡献一份力量。几十年后回头看,会觉得很自豪——你在留形做的工作,真的推动了机器人走进人类生活。这是一个跨时代的挑战。

我前段时间还发了条朋友圈,虽然听起来有点中二,但是真心的,欢迎大家「一起加入光荣的进化吧」!

本期音频内容同步上线真格基金播客「此话当真」,欢迎收听~

文字|Cindy

播客|Jiamin

编辑|Wendi

监制|Qian