客观聊聊蔚来NWM世界模型!
终于推送了,体验视频后和大家聊聊蔚来NWM:
过去,蔚来AD的团队过去面临着很大的压力,甚至是质疑。从城区NOP能力开始,蔚来的节奏明显放缓。或者说是和国内发展的步调有差别,比如重心放在主动安全能力上,而这些可能都是用户体感比较弱的场景。现在蔚来终于推出了一个世界模型的大版本,我们也和大家聊聊...
1、一个重要的背景。
我记得李斌去年开始对外开始强调辅助驾驶的核心是解放精力、减少事故。这是一个重要的信号。
蔚来过去做每个项目似乎都有一套极为严谨的方法论,比如蔚来的换电方法论非常成熟,那蔚来就会不惜代价的投入,但辅助驾驶在很长一段时间,蔚来似乎都是一个比较模糊的边界,直到李斌去年开始谈到,特别是主动安全的发力。
而世界模型的命名,也意味着蔚来开始像换电体系一样,要构建一套长期投入、有长期回报、用户有长期价值回馈的系统,这也是蔚来定义世界模型的初衷。
所以世界模型并不是文字游戏,而是内部就把架构原本定得很高。蔚来最终也没有选择“主流”的从两端或者一段式端到端阶梯式的演进方式,而是以四颗 Orin 为起点,不分新老用户,直接走到了世界模型。
2、一个客观的现实。
这也意味着 NWM 这次有个重大的前提是它不是一个 A 版本到 B 版本的升级,NWM 在蔚来体系下更像一本书。这次我们体验的只是第一个版本,更像书最前面的目录。
所以这次露出的功能无论从主动安全、高速、城区、泊车都全部推送,完整度高,但作为第一个版本,大家体验上也不要有过高的预期,比如预期所有能力都是第一梯队的水平。
蔚来也没有走从两端到一段式端到端这种阶梯式路线,而是直接重建一个新的世界模型。目录里面的内容怎么展开,我觉得是接下来 1-3年 NWM 需要做的事。
但从目前功能的规划和世界模型的上限看,NWM 最近几年的发展确实有非常强大的想象空间。
3、为什么这次「地库」能力最值得看?
目前团队共划分有三个小组,一个是行车组、还有一个地库探索组和一个车位泊车组。但是研发上大家没有分别,划分三个组的意义是要对每个产品的体验和结果负责。所以这次视频中我们也重点和大家聊这三个能力。
为什么主讲地库。是因为世界模型如果放到城区里面,我觉得短期内并不性感,因为世界模型需要更多的数据量、更大的算力,现在蔚来已经拿到了行业内为数不多高的算力资源,但分配到城区依旧是一件更长周期性的事。
这里面需要一个过程是,你怎么把模型压缩,压缩算力,让模型处理更多场景。但如果看回地库,发现这是一个更好的落地环境。
地库环境比较封闭,文字、道路标识和行径轨迹比较统一,无非是左右转和直行。所以 NWM 可以更好的释放出完整能力。
比如这次的探索模式,蔚来靠地面箭头、天花板的出口中文等,来实现找出口,这个能力可以实时在车机上交互,告诉大家目前系统的想法和动作,最后尝试找到出口位置。
这是第一个阶段的能力找出口,而我们基本可以预测未来这个能力会向上升级到找楼栋、门牌号、地库的负几层、ABCD各种编号的停车场等。而且 NWM 更重要的能力还有自学习,比如学习旁边的车怎么开,前后两个路口哪个会是真正的出口,绕桩路线怎么走更好,这些都会做更多的学习。
还有这次还打通了行泊一体。NMW 实际在泊车上除了找车位上,也定义了一个功能是远距离车位,这个能力更像把我们上面的探索模式+泊车能力做打通。
我觉得这个功能在一定阶段上是一个过渡性功能,未来当车位到车位,也就是城区高速+地库探索所有能力打通后,会形成一个强大完整体。
4、那是不是意味着蔚来 NWM 放弃了记忆的模式?
其实并不是。
我们知道人开车最好的方式也是记忆和推理双结合。现在我们做车位到车位一般有两种方案,一种是靠强记忆,或者众包,这种是国内的做法,但不通用。另一种是靠强推理,也就是特斯拉FSD,好用但容易绕圈出不去。
蔚来 NWM 第一阶段我觉得解决了认知能力,推理能力依旧需要更大量的数据学习,结合记忆的方式,实现更通用性的能力。
5、行车小路升级明显 但还有优化空间。
这次从体验的结论是 NWM 的城区道路相比老版本有升级,但是明显感受数据泛化可能还不够多,在一些路面拓扑理解或者动态博弈上,处理和效率上还不够高。
惊喜的地方是在单一的小路场景,这种带一个车道、复杂博弈、窄路通行,是 NWM 最强的特点,无论是走位、绕行还是穿行,都非常强。
当然回归到行车本身最大升级能力还是主动安全,比如针高速自主靠边停车、后向防追尾、通用障碍物GOA,还加上高速驾享模式,这个模式也是为了高阶能力做准备,这里面都是小章节,后续升级都是按照小章节分目录升级,我们现在只是看到的第一个版本能力。
所以从完整度看这也是有史以来蔚来推送的最完整度的版本,主动安全、行车泊车、车位到车位、ETC 抬杆全面量产。从客观维度看,我们也需要给 NWM 一些时间,世界模型的上限依旧充满着无限想象力。
蔚来世界模型来了蔚来汽车