云启伙伴 | 元戎启行 x 火山引擎,携手加速Agent上车
从驾驶工具到智能体,汽车正在进化

当汽车不再只是交通工具,而成为拥有感知、理解与决策能力的智能体,它正在从"会开车"走向"会思考"。
近日,云启被投、国内领先的智能驾驶企业元戎启行,联合火山引擎重磅发布其最新视觉-语言-动作模型(VLA),并同步揭晓"透视眼""百事通""翻译官""应答灵"四大核心能力,标志其AI司机技术迈入全新阶段。
本期**「云启伙伴」**将带你深入了解元戎启行如何探索用VLA模型构建智能驾驶"通才能力",推动通用人工智能在物理世界的真实落地。
以下内容转载自"元戎启行DeepRoute"
作为国际领先的人工智能企业,元戎启行致力于打造"物理世界的通用人工智能",以创新技术打造AI司机,实现RoadAGI。6月11日,元戎启行在火山引擎Force原动力大会发布两个新进展。
💡进展一
元戎启行宣布携手火山引擎,围绕豆包大模型能力,共同打造物理世界的Agent。让智能深入现实,共创AI驱动的未来世界。
💡进展二
元戎启行发布VLA模型最新四大功能:"透视眼"、"百事通"、"翻译官"、"应答灵"
(VLA为视觉-语言-动作模型)
1、空间语义理解
相当于为AI汽车装上驾驶"透视眼",专为破解桥洞通行、公交车遮挡视野等动静态驾驶盲区设计,全面还原、了解驾驶环境,精准破解盲区驾驶风险。例如在桥洞道转弯场景中,VLA模型能够识别"注意横穿 减速慢行"的指示牌,注意公交车动态盲区风险,从而推理出前方可能有行人横穿,谨慎通行,安全为上。

2、异形障碍物识别
如同**"驾驶万事通"**,是VLA超级学神,能够秒吸收互联网海量知识,并将实战经验全部入库。从此corner case变成小case,行车难题"百事通"。例如辨别各类异形超载小火车,安全绕行,一路坦途。

3、文字类引导牌理解
堪称**"驾驶翻译官"**,能读懂复杂标识的文字含义,高效读懂路牌并精准选路。例如在可变车道或多车道复杂路口,精准理解文字类待转区指示牌,匹配车道并执行操作,在正确的时间走正确的路。

4、语音交互控车
在语音交互控车方面,VLA模型展现出"稳、准、灵"的高效响应能力,真正做到**"听劝应答灵"**。用户只需通过自然语音下达指令,如"速度慢些""前面第三个路口左转""下个路口掉头"或"靠边停车",系统即可秒级响应并精准执行。
同时,VLA能够实时感知路况变化,辅助用户做出如"不要走公交车道""变道远离大车""超过前面慢车"等安全合理的行驶决策,不仅懂路,更懂用户,打造更加智慧、安心的出行体验。

随着VLA模型四大核心能力的发布,元戎启行再次刷新了智能驾驶的技术上限。从"透视眼"到"应答灵",VLA不仅为AI汽车赋予了前所未有的环境感知与交互能力,更进一步推动通用人工智能在现实世界中的具身落地。

元戎启行成立于2019年,成功推出最新一代不依赖高精度地图、应用端到端模型的智能驾驶平台DeepRoute IO,以及新一代VLA模型(视觉‑语言‑动作模型),且凭借富有竞争力的产品和服务与多家车企建立了量产合作关系,共同推进十余款车型的落地。预计2025年底,将有超20万辆搭载元戎启行组合辅助驾驶方案的车辆进入消费者市场。
我们也期待元戎启行能够继续以技术为基、以落地为本,勇敢开拓,驶向智能化时代的全新里程。





