WAIC2024观察:AI“下凡”进行时 | 云启Attent!on科技手账
机器人、大模型、AI应用,卷出哪些新高度?

展商500+、展品1500+、线下观展人数30万+,刚刚落幕的2024世界人工智能大会(下称WAIC 2024)创下诸多历史新高,和上海接近40度的高温一样火热。从门口卖票的"黄牛",到一座难求的餐厅、咖啡厅,各种场外花絮也告诉我们,曾经被视作黑科技的**AI正在"下凡"出圈,**初现国民化的曙光。
云启和多家伙伴企业也携新洞见和新展品再次亮相WAIC。与此同时,我们也在大会展览和嘉宾发言捕捉到一些新趋势和新风向。
WAIC余温未退,我们带来本期「云启Attent!on科技手账」,通过三个关键词回顾我们带给WAIC的,和WAIC带给我们的。

登上C位的
机器人
"肢体动了,DNA还在动的路上"
从展览馆大厅陈列的人形机器人"十八金刚"阵列,到今年首次开设的机器人专区,动辄水泄不通的人流密度告诉我们,机器人是本届大会当之无愧的C位。据官方披露,今年WAIC共有56款具身智能产品首次亮相,其中除特斯拉Optimus2以外,均为国产机器人。云启两家早期被投睿尔曼智能、擎朗智能亮相其中。
睿尔曼带来轻量仿人机械臂和复合型机器人的创新应用成果。展品包括能轻松举起5Kg哑铃的机械臂、能因人而异给人体不同穴位按摩的"马杀鸡机器人"等一系列贴近生活、生产的产品。在具身智能浪潮下,睿尔曼的机械臂技术优势将为机器人本体操作能力的提升持续赋能,目前已经构建起丰富的合作伙伴生态。此次与宇树、傲意这两位合作伙伴共同亮相WAIC即是一个缩影。
擎朗智能携覆盖餐饮、酒店、医疗、教育等场景的全系列新品亮相。最大承重40斤、一趟能"交付"4单的四仓酒店机器人W3、支持掌静脉识别的医疗配送机器人Gen2……擎朗对多个品类做出升级,另外还计划将其基础大模型能力接入送餐旗舰机型T10,在任务理解、感知决策、分析推理等维度提升产品的智能水平。
在形态各异的机器人产品中,最引人注目的当属人形机器人。官方披露,在亮相大会的42款智能机器人,有22款是人形机器人。除了在玻璃柜里"独美"的特斯拉Optimus,其他人形机器人Demo都通过表演展示了夹、捏、握、拧、走等活动能力,直观展现机器人肢体技术的进化。
云启天使轮项目松应科技的Orca物理精确模拟器也被应用到大会展出的人形机器人"青龙"中,在软件层面赋能机器人运动协调性和自主决策能力。

"十八金刚"阵列、睿尔曼智能展位、擎朗智能展位
云启快评
机器人在WAIC2024的火爆反映出行业内外对具身智能的期待。通用性、泛化性是具身智能的核心技术优势和商业优势,自主学习物理世界经验、能力边界得到拓展、从"一机专用"到"一机多用",是具身智能时代的机器人被寄予的厚望。
AI大模型是具身智能泛化性优势能否真正释放的关键,关乎机器人感知、决策和行动能力能否取得阶跃式突破。目前具身智能的基础模型方案尚未收敛,模型层面的针对性突破值得期待。

不再卷参数的
大模型
"改卷多模态和垂直化了"
大模型仍是本届WAIC的一大主角。大会现场展出了上百款大模型产品,大会评选出的八大「镇馆之宝」中大模型产品也占到三个。不过与一年前卷参数的态势有所不同,"多模态"和"垂直化"成了关键词。
多模态方面,商汤发布的对标GPT-4o的"日日新V5.5",以及首个面向C端用户的可控人物视频生成大模型Vimi受到众多关注。后者能够生成长达1分钟以上的单镜头人物视频,入选今年的「镇馆之宝」。
云启天使轮项目MiniMax创始人、CEO闫俊杰也在大会透露,MiniMax的视频生成模型产品拟于8月发布,相应功能将在「星野」上线。另外在MiniMax展台,我们听到了由MiniMax abab-music 大模型作词、作曲的歌曲。现场工作告诉我们,作曲功能也将在「星野」上线。
垂直化则在一些互联网公司和国央企推出的大模型产品中格外强烈,金融、医疗、教育、旅游等领域均有对应的大模型展出。譬如,蚂蚁集团的百灵大模型支撑金融AI助理"支小宝"落地,教育领域的网易有道和猿辅导分别推出"子曰"和"看云"大模型。
其实,无论是多模态还是垂直化,围绕的核心都是可落地。而要真正满足具体场景的需求,模型能力的迭代是持续的课题。
在大会论坛中,闫俊杰指出,大模型目前最核心的问题还是模型错误率较高,比如GPT-4在很多测试指标上可能正确率只有60%、70%,意味着有30%至40%的错误率。这也是大模型产品多采取对话形式的原因所在,因为对话的容错率较高。而模型错误率从30%至40%降到3%至4%、甚至2%,错误率降低一个数量级,是让AI从辅助人类的工具到独立完成工作的最核心的标志。

云启天使轮项目、大模型独角兽MiniMax展位
云启快评
GPT4发布一年多后,模型能力的进阶速度显著放缓,从快速迭代进入渐进迭代模式。但模型的细微差别仍会带给用户迥然不同的体验,因此基础能力的打磨和突破模型层当下的重点。
与此同时,多模态大模型和垂直大模型的技术突破也将给应用层创新带来更大空间,推动AI融入更多场景。

正在崛起的
AI应用
"大模型之后的新主角"
仔细逛展不难发现,本届WAIC的展区面积大户大多也是AI应用产品大户。阿里巴巴、科大讯飞、WPS等都在展区策划上穷尽巧思,以期告诉观众AI可以如何融入工作和生活的各个角落。
亮相展会的软件应用和功能囊括了C端、B端、G端等各个市场。但应用场景和功能基本大多都围绕生产力提效展开。行业热议一年多的Agent能力也在一些工具中初现,譬如在支付宝发布的AI智能助手,支持用户下达点外卖、充话费等指令,AI识别指令后可以直连支付宝生态内相应的小程序。
另外也有不少叠加了AI功能的硬件应用引得观众围观。比如以及科大讯飞能将粉笔手写的板书直接数字化的智慧黑板,都是本届WAIC的热门打卡点。
对于自动驾驶这一AI重要落地应用领域,本届WAIC也设置了一个专区。云启早期项目觉非科技携基于数据闭环的智能驾驶大模型亮相,展示了解决方案在城市NOA、高速NOA的落地能力。
而在大会论坛上,AI的应用落地前景也成为热议的一大重点。云启合伙人陈昱在"AI创新应用与投融资趋势"论坛表示,过去一年投资界在AI领域的重心集中在基础模型,未来两三年则会把重点放在AI应用上。而生产力提升、AI for Science、具身智能、娱乐是大模型应用的几个重点方向。
关于AI在toB领域应用前景,云启执行董事韩义在"长三角协同创新AI新质生产力发展论坛"分析道,营销获客和内部增效是AI为企业解决的两个核心问题。围绕这两大需求,AI在toB领域有较为丰富的应用形式。
围绕频频被讨论的Killer App,MiniMax创始人、CEO闫俊杰认为,可能要3年后(可能)才会有大众化的东西。"但没关系,当你能做到第一个,然后你的能力变强、资源变多、技术能力变好,有可能大概就可以做。"
云启快评
开源模型的崛起和大模型价格的快速下降为AI应用开发者降低了大模型的使用门槛和使用成本,在技术和成本角度均利好AI应用创新。在AI工具箱的加持下,具备优秀产品能力的人或团队,其优势将被放大。
但囿于大模型自身的能力缺陷等因素,应用层的ChatGPT时刻或难有清晰的时间表,模型层的能力进阶是应用层爆发的关键所在。
WAIC2024落幕,创新仍在继续。云启和伙伴企业持续深耕AI,也会持续分享我们的观察与思考。期待共同见证更多创新。


