云启伙伴 | 元戎启行 x 火山引擎，携手加速Agent上车

云启资本·2025年6月16日·3·0

从驾驶工具到智能体，汽车正在进化

当汽车不再只是交通工具，而成为拥有感知、理解与决策能力的智能体，它正在从"会开车"走向"会思考"。

近日，云启被投、国内领先的智能驾驶企业元戎启行，联合火山引擎重磅发布其最新视觉-语言-动作模型（VLA），并同步揭晓"透视眼""百事通""翻译官""应答灵"四大核心能力，标志其AI司机技术迈入全新阶段。

本期**「云启伙伴」**将带你深入了解元戎启行如何探索用VLA模型构建智能驾驶"通才能力"，推动通用人工智能在物理世界的真实落地。

以下内容转载自"元戎启行DeepRoute"

作为国际领先的人工智能企业，元戎启行致力于打造"物理世界的通用人工智能"，以创新技术打造AI司机，实现RoadAGI。6月11日，元戎启行在火山引擎Force原动力大会发布两个新进展。

💡进展一

元戎启行宣布携手火山引擎，围绕豆包大模型能力，共同打造物理世界的Agent。让智能深入现实，共创AI驱动的未来世界。

💡进展二

元戎启行发布VLA模型最新四大功能："透视眼"、"百事通"、"翻译官"、"应答灵"

（VLA为视觉-语言-动作模型）

1、空间语义理解

相当于为AI汽车装上驾驶"透视眼"，专为破解桥洞通行、公交车遮挡视野等动静态驾驶盲区设计，全面还原、了解驾驶环境，精准破解盲区驾驶风险。例如在桥洞道转弯场景中，VLA模型能够识别"注意横穿减速慢行"的指示牌，注意公交车动态盲区风险，从而推理出前方可能有行人横穿，谨慎通行，安全为上。

2、异形障碍物识别

如同**"驾驶万事通"**，是VLA超级学神，能够秒吸收互联网海量知识，并将实战经验全部入库。从此corner case变成小case，行车难题"百事通"。例如辨别各类异形超载小火车，安全绕行，一路坦途。

3、文字类引导牌理解

堪称**"驾驶翻译官"**，能读懂复杂标识的文字含义，高效读懂路牌并精准选路。例如在可变车道或多车道复杂路口，精准理解文字类待转区指示牌，匹配车道并执行操作，在正确的时间走正确的路。

4、语音交互控车

在语音交互控车方面，VLA模型展现出"稳、准、灵"的高效响应能力，真正做到**"听劝应答灵"**。用户只需通过自然语音下达指令，如"速度慢些""前面第三个路口左转""下个路口掉头"或"靠边停车"，系统即可秒级响应并精准执行。

同时，VLA能够实时感知路况变化，辅助用户做出如"不要走公交车道""变道远离大车""超过前面慢车"等安全合理的行驶决策，不仅懂路，更懂用户，打造更加智慧、安心的出行体验。

随着VLA模型四大核心能力的发布，元戎启行再次刷新了智能驾驶的技术上限。从"透视眼"到"应答灵"，VLA不仅为AI汽车赋予了前所未有的环境感知与交互能力，更进一步推动通用人工智能在现实世界中的具身落地。

元戎启行成立于2019年，成功推出最新一代不依赖高精度地图、应用端到端模型的智能驾驶平台DeepRoute IO，以及新一代VLA模型（视觉‑语言‑动作模型），且凭借富有竞争力的产品和服务与多家车企建立了量产合作关系，共同推进十余款车型的落地。预计2025年底，将有超20万辆搭载元戎启行组合辅助驾驶方案的车辆进入消费者市场。

我们也期待元戎启行能够继续以技术为基、以落地为本，勇敢开拓，驶向智能化时代的全新里程。