|
WA线的方针并非间接仿照驾驶动做,而是为机械建立一个可以或许进行空间认知和时间推演的内部“虚拟世界模子”。让汽车像人一样“理解”物体、速度、距离的彼此关系及行为后果,从而做出合适物理纪律和常识的决策。 这场手艺争议的泉源要逃溯到本年8月,王兴兴界机械会上暗示:“VLA是一个相对傻瓜式的架构。”王兴兴认为目前VLA模子对实正在世界的交互,数据质量还不敷。“大师对于根本数据的关心度太高了”他强调,该当把核心放正在具身机械人的模子架构上,由于现正在的模子“不敷好,也不敷同一”。 VLA线的焦点是“步履派”:通过端到端模子,它逃求高效、拟人化的驾驶行为,劣势正在于能操纵大规模车队敏捷收集数据,实现体验的快速迭代和优化。 当手艺逐步穿透噱头,回归驾驶的素质,谁能正在平安、舒服取的标准上,率先找到那把通往“汽车机械人”的钥匙,谁才能实正启动下一个挪动时代。 将来,大概不会有单一的“胜出”方案,而是正在场景分化中融合——WA建立理解世界的“大脑”,VLA应对现实的“天性”,两者协同形成智能驾驶完整的神经中枢。而无论选择哪条径,海量高质量数据、强大算力取工程化落地能力,都将成为穿越手艺深水区的配合基石。 为了实现第二代VLA量产上车,小鹏汽车通过“芯片-算子-模子”全链优化,正在2250 TOPS算力的Ultra版车型上,实现了数十亿级参数模子的搭载,远超行业万万级参数量的遍及程度。 对于VLA模子的将来,郎咸朋给出了明白的手艺线图。按照他的预测,若是来岁抱负汽车能做到1000 MPI(每1000公里接管一次),VLA将送来Chat GPT时辰。这意味着VLA模子将正在现实道上展示出接近人类程度的驾驶能力。郎咸朋还预测,跟着VLA模子的不竭进化,它以至可能正在某些场景下超越人类司机的表示。 小鹏汽车同样对第二代VLA投入了庞大的资本取决心。正在前不久的小鹏科技日,小鹏汽车正式推出第二代VLA,其焦点冲破正在于打消了“言语转译”环节,实现从视觉信号到动做指令的端到端生成,沉构了行业保守的“V-L-A”架构。
抱负取小鹏皆是VLA的果断结构者:小鹏汽车正在12月底将正式第二代VLA的前锋内测;而抱负汽车OTA 8。1版本车机系统正在12月6日曾经推送,环绕辅帮驾驶、智能座舱。 12月10日,抱负汽车从动驾驶研发高级副总裁郎咸朋正在微博发布长文,回应宇树科技创始人王兴兴此前对VLA(视觉-言语-动做)模子的质疑:“VLA就是从动驾驶最好的模子方案”“空口说架构不如看疗效”。
对于为什么时隔四个月才为VLA“出头”,郎咸朋正在回应中注释:“一是(其时)抱负VLA司机大模子还没正式发布,空口无凭;二是我们对具身机械人行业,还处于亲近关心阶段。”本年9月,抱负VLA正式发布,12月6日OTA 8。1推送,两个月多的“实践”让郎咸朋愈加果断了本人的选择。 的数据根本为抱负VLA模子的迭代供给了络绎不绝的动力。郎咸朋暗示,抱负不只能够从过去几年堆集的十几亿公里的存量数据里进行挖掘和筛选,更能够通过150万车从的日常利用络绎不绝地获取新的数据。数据不是静态的、无限地存正在,而是动态的、持续增加的过程,形成了抱负汽车从动驾驶能力的数据根本。 基于第二代VLA,小鹏汽车小NGP功能即将发布,复杂小平均接管里程(MPI)提拔13倍,且正在测试中自从出现出手势识别、红绿灯提前应对等未锻炼场景的适配能力;行业首发的“无从动辅帮驾驶”Super LCC+人机共驾模式,无需依赖即可全球,支撑人机协同变道转向。 当VLA取WA正在架构取数据、取认知、仿照取理解之间展开深度博弈,我们看到的不只是手艺线的分化,更是整个行业对“机械若何学会驾驶”这一底子命题的度摸索。这场辩论没有简单的对错,唯有实正在世界的复杂性取平安性才是最终的裁判。 抱负对VLA的力挺,取其“汽车机械人”的持久计谋深度绑定。抱负汽车董事长兼CEO李想曾暗示,将来五到十年,具身机械人焦点将有两种形态:汽车类的具身机械人、人形类的具身机械人。正在他看来,具备L4级从动驾驶能力的汽车,素质就是一台汽车机械人。
戏剧性的是,就正在郎咸朋发声次日,12月11日,小鹏汽车董事长、CEO何小鹏也针对VLA发布了微博长文:若是正在2026年8月30日,小鹏的VLA正在国内达到特斯拉FSDV 14。2正在硅谷的全体结果,他将正在硅谷筹建一个中国风味食堂;反之,小鹏从动驾驶担任人刘先明将“正在金门大桥裸跑”。 短短两日之内,来自制车新头部阵营的两位高管先后强势发声,让VLA这一备受争议的手艺线被推上了风口浪尖。 何小鹏正在近期的采访中提出无人驾驶要能实现“大、小、高速、胡同、户外”全场景的平安通行,处理并要能提前预判处理各类长尾问题,才能指向实正的无人驾驶将来。 VLA手艺线的,除了小鹏、抱负,还有奇瑞、吉利等企业;而WA线的典型代表,是华为取蔚来。华为智能汽车处理方案BU CEO靳玉志曾暗示:“华为不会走VLA径,如许的径看似取巧,其实并不是实正从动驾驶的径。华为更看沉WA,这个径目前看起来很是难,但能实现实正的从动驾驶。”蔚来创始人将其自研的NWM(NIO World Model)视为手艺架构的基石,他暗示,蔚来的智能驾驶世界模子NWM正在优先保障平安的前提下,一曲外行业中都处于领先的。 抱负汽车给本人的定位是具身智能企业,VLA模子正在这一计谋中饰演着环节脚色。李想认为,实现汽车机械人必需添加对物理世界的和理解能力。而VLA模子刚好具备对物理世界极强的理解能力,这种能力是其他手艺架构难以匹敌的。 小鹏汽车依托3万卡云端算力集群(集群运转效率常年连结正在90%以上)摆设了720亿参数基座模子,实现每五天全链迭代一次。正在模子锻炼层面,第二代VLA无需人工标注,间接采用近1亿clips实正在驾驶视频,笼盖相当于人类司机65,000年驾驶经验的极限场景,并可通过场景推演生成长尾场景进行匹敌锻炼。
王兴兴之所以断言“VLA是一个相对傻瓜式的架构”,缘由正在于其认为目前VLA模子对实正在世界的交互,数据质量还不敷。“大师对于根本数据的关心度太高了”,他强调该当把核心放正在具身机械人的模子架构上,由于现正在的模子“不敷好,也不敷同一”。 除了数据劣势,VLA模子正在系统适配性上也展示出奇特价值。抱负汽车不只将VLA视为一个模子,更将其做为整个具身智能系统的无机构成部门。郎咸朋强调,要做好从动驾驶,必需先把从动驾驶当做完整的具身智能系统看待,包罗(眼睛)、模子(大脑)、操做系统(神经)、芯片(心净)和本体(身体)等部门的协同感化。 这场“对线”最焦点的不合正在于:王兴兴认为模子架构更主要,而郎咸朋则认为“模子的环节是要取整个具身智能系统适配,正在此根本上,数据是起决定意义的”。两边概念也反映出了当前智能驾驶的两大手艺线——VLA线取WA(世界模子)线之间的不合。 |