云启Attent!on播客 | 对话上下游创业者:具身到智能,AI如何“唤醒”机器人?
聊聊落地百态与应用瓶颈

在会学习、能思考、随便动的"机器人之梦"实现之前,还有哪些细分切口和场景能释放具身智能的技术优势?真正实现具身智能的通用性和泛化性,需要跨过哪些鸿沟?早期投资视角下,具身智能的商业模式和布局逻辑是什么?
关于上述问题,在近期举办的云启云际会DemDay具身智能专场中,睿尔曼智能、星尘智能、C12.ai这三家身处具身智能生态中不同环节的云启被投创始人,与云启合伙人陈昱一道展开了精彩讨论。
本期**「云启Attent!on 具身智能系列」**带来此次讨论的精华内容。文字版和完整版音频都有,与您分享。

欢迎扫描上图二维码或在小宇宙关注「Attent!on」收听本期节目
· 对话嘉宾介绍:
陈昱,云启合伙人
深耕AI、机器人领域,代表投资案例包括MiniMax(大模型独角兽)、擎朗智能(餐饮机器人领军企业)、元戎启行(自动驾驶头部企业)、PingCAP(开源数据库独角兽)等。
郑随兵,睿尔曼智能CEO
睿尔曼智能是全球领先的超轻量仿人机械臂创新企业,拥有十余年协作机械臂及核心零部件研发经验。公司服务超过4000家企业用户,积累了上千个标杆案例。
来杰,星尘智能CEO
拥有16年机器人研发经验,曾是腾讯机器人实验室1号员工、百度"小度机器人"团队负责人。星尘智能致力于打造全能操作机器人,首款AI机器人预计8月发布完整机体。
陈志刚,C12.ai CEO
曾任职于药明康德(首席数字官)、腾讯医疗大数据实验室(负责人)、阿里健康(总架构师)等。C12.ai致力于打造验室具身智能,为医药研发实验室提供新一代智能化解决方案。
以下是本期节目的节选内容

01 人形机器人"出圈"WAIC启示录
陈昱,云启合伙人
今年WAIC(世界人工智能大会)最抓眼球的肯定就是门口的十八金刚,大家也可以看到看市场上有这么多人形机器人,百花齐放。为什么是今年呢?那我觉得很大的一个原因是科技发展到现在这个程度,从算力、大模型、机器学习理论、硬件,都已经为具身智能做好了准备。所以大家一下子就能够看到这么多家企业都纷纷推出了人形机器人。
郑随兵,睿尔曼智能CEO
我觉得具身智能火爆,是因为它满足了大家对未来的一个想象。我们希望能够造一个跟我们一样有能力的人,甚至说我们想造一个神,所以这样来看,人工智能落在这个机器人上是一个必然的点。
过去这些年,波士顿动力、特斯拉等公司的尝试,让机器人在AI爆发之前具备了操作能力。而大模型的出现,又解决了机器人的一个关键能力,嵌套逻辑能力。说我们让机器人去开冰箱、拿可乐,它知道这个逻辑,走过去打开冰箱门。如果你再问它冰箱门怎么打开,它会告诉你这个冰箱门我先看到把手,抓把手、再拉开门。你会发现它里边有了嵌套逻辑能力。嵌套逻辑能力恰恰就解决了机器人领域在应用过程中部署的泛化能力。
机器人走入生活有三大瓶颈:泛化能力、操作能力和成本。其中两个点已经解决了。
02 让人形机器人自如移动,需要跨过两个gap
来杰,星尘智能CEO
具身行业的发展其实有两个gap:一是端侧的 AI 和机器人本体之间的gap,二是具身智能和大模型之间的gap。如果想达到非常流畅的展示,首先本体要达到一定的性能和稳定性,其次端侧的AI带给本体泛化能力和自适应能力,这样的完整结合才可以让它很自然地进行展示。
当然对于我们来说,目前做的事还是偏向于数据驱动。让机器人在自适应和泛化性的能力之下,去完成当前的任务。我认为是一个双向奔赴的过程,如果简单地只是在一些机器人的上面去增加一些 AI 能力,在 Demo 的时候会暴露很多的它的缺点。
所以我们现在致力于先解决本体和端侧AI之间的gap,通过联合的顶层架构的方式去设计AI模型和本体。同时也在做AI的agent ,甚至也在推动世界模型的发展,在这个过程中打造大家想象中的能出现在大家身边的机器人形态。
03 具身智能+药物研发,怎么落地?
陈志刚,C12.ai CEO
医药研发场景中,很多任务很难用一个端到端模型去完成。举个例子,全球现在已经发现了数千个药物靶点,我们实际上是在 60 次方的化合物空间去寻找药物,合成的过程中要做大量的实验。很多实验是人们从来没有做过的,其间很多探索过程存在一个分层结构。这个分层结构就是我们现在要设计的专业的大脑。
这些大脑实际上是把非常复杂的任务做了分解,用到的办法叫long-range。这个办法的好处是,通过分解复杂问题使其可以被可控地解决。第二,可解释性被增强,不同于端到端模型出了问题难以溯源,long-range模式下,我们可以对任务设计做及时的调整、干预。
同时,具身智能的落地还有赖于整个生态的发展。未来软件层和硬件控制层的合作可以助力我们更好地去探索落地空间。
04 人形机器人是具身智能的终极形态吗?
来杰,星尘智能CEO
刚好我2021年之前都是做双足的,但在出来创业之前仔细思考过这个问题。首先第一个问题是使用时间的问题。我们认为,机器人发展有商业价值的第一个要素就是它能有足够的工作时间,很明显这是双足目前很卡脖子的问题。所以我们认为操作能力有更大的价值,而移动的底盘会给它来带来稳定性,和更长的使用时间。所以我们选择了把全面的操作能力先做出来。
说到终局,我觉得如果能源发展的话,有可能人形会大幅发展。或者的话就是在一些特殊的场景下,比如说山地之类的,确实对人形是有需求的。
陈昱,云启合伙人
大家的梦想肯定是想做人的形态,理由也是非常充分的,毕竟现在环境都是围绕着人来打造的。但从技术和成本考量,是否要做双足,我觉得这不是必须的。因为从实用性角度,这个操作能力会更加重要。但是终极形态肯定还是偏人形。
05 具身智能的商业模式是什么?我们的布局逻辑是什么?
陈昱,云启合伙人
具身智能最终应该是替代或辅助人去完成一些工作,所以商业模式肯定是对标人的。如果在一些应用场景下,比如C12.ai聚焦的医药实验室等人工成本较高的场景,机器人能够做到比相应的人工成本更便宜,那市场肯定会买单。
更终局的视角下,大家最后都需要一个全能的个人助理,这个商业模式还需要很长一段时间。但我觉得这和自动驾驶的发展模式有些类似,大概在2014年-2016年,我们已经能够看到自动驾驶的雏形在路上跑了。我相信现在具身智能也在走同样的路,我们先把雏形做出来,再花5-10年把链条上各个环节的成本降下来。
从投资角度来看,具身智能是一个非常复杂的行业,涉及软件、硬件多个层级,包括零组件、本体、数据采集、模拟器等等,我们作为投资机构目前希望尽可能全面地做布局。
此外,具身智能的技术路线尚未收敛,有端到端机器学习方案、大模型加强化学习的方案,还有其他方案。在技术早期我们也会多布局不同技术路线的公司,未来技术路线可能也未必收敛,可能每种技术路线都有存在价值,都能够做出高性价比、高功能的具身智能。
播客时间轴
01:29 本期话题与嘉宾介绍
06:24 人形机器人"出圈"WAIC启示录:大模型解锁机器人泛化能力
12:27 机器人走入生活的三大瓶颈:泛化能力、操作能力、成本
13:46 积极拥抱具身智能的行业有哪些?
14:56 如何让人形机器人动起来?两个gap待解:端侧AI VS 机器人本体;具身智能 VS 大模型
16:14 具身智能的商业价值几何?AI机器人创业者这么看
17:43 人形机器人是具身智能终极形态吗?
20:12 人形机器人是具身智能终极形态吗?
26:03 产业生态前瞻:上下游企业协同 or 大型平台企业"包干"?
27:14 早期投资视角下的商业模型与布局逻辑




