小鹏 X-Mind 亮相,自动驾驶预见未来
小鹏汽车发布 X-Mind 技术框架,赋能自动驾驶“预见未来”
小鹏集团近日正式发布了名为 X-Mind 的技术框架。该框架旨在解决当前自动驾驶模型在主动思考和提升预见能力方面的挑战,通过内嵌预测性世界模型,为车载智能体提供了高效的视觉思维链,有望攻克认知推理与实时计算之间的矛盾,让自动驾驶系统具备“预见未来”的能力。

X-Mind 的核心在于将预测世界模型无缝集成到大型驾驶模型中。它利用循环块扩散机制,通过渐进式去噪步骤生成紧凑的抽象草图,从而推演出预期的物理未来。基于这一推演,车辆的规划器能够得出最优的自车轨迹。研发团队通过实例化视觉思维链(Visual CoT),在动作生成前进行显式时空推演,使得车辆能够像经验丰富的老司机一样,提前思考并规划路径,充分考虑未来交通流的变化,从而实现更强的防御性驾驶能力。

该技术框架摒弃了对高清纹理的过度追求,转而构建了一个融合了鸟瞰图(BEV)布局与抽象驾驶先验的“认知画布”。思维草图不仅包含物理场景元素(如车道线、障碍物)、动态交通灯状态,还融入了自适应导航意图和合规车速轮廓。通过深度压缩自编码器(DC-AE),X-Mind 能将复杂的未来世界推演压缩至极少的 Token,有效过滤掉与规划无关的纹理干扰,仅保留道路拓扑、交通灯状态和导航意图等核心语义先验,从而从根本上解决了长上下文带来的计算瓶颈,并在真实世界数据上展现出显著的优势。

在实际测试中,X-Mind 在面对前车急刹、匝道汇入及复杂十字路口等场景时,均能提前推演出障碍物占位和场景因果链条。对比数据显示,X-Mind 在轨迹预测误差(ADE)方面相较于传统 VLA 模型有显著降低,尤其在复杂长尾场景下,安全性和合规性大幅提升。同时,其推理延迟极低,具备了在资源受限的车规级芯片上量产落地的可行性,效率上实现了革命性的突破。

X-Mind 技术框架的发布,标志着小鹏汽车在自动驾驶领域的技术实力再进一步。其“预见未来”的能力,有望在实际驾驶中带来更安全、更平顺的体验,尤其是在应对突发状况和复杂交通环境时,能够提供更智能、更具前瞻性的决策支持。
小鹏汽车发布 X-Mind 技术框架,驱动自动驾驶“预见未来”
小鹏汽车近期发布了其全新的 X-Mind 技术框架,该框架通过内嵌预测性世界模型,赋能车载智能体实现高效的视觉思维链。核心突破在于攻克了认知推理与实时计算之间的矛盾,旨在让自动驾驶系统具备“预见未来”的能力,从而提升驾驶的安全性和智能化水平。

X-Mind 的整体架构设计是让预测世界模型深度融合到大型驾驶模型之中。利用循环块扩散机制,该技术能在单次前向传播中,通过渐进式去噪步骤生成紧凑的抽象草图,进而基于对物理未来的预推演,使规划器能够计算出最优的自车轨迹。小鹏研发团队将视觉思维链(Visual CoT)具体实现,在生成动作前进行显式的时空推演。这意味着车辆能够像经验丰富的驾驶员一样,提前思考潜在的交通状况变化,制定更具防御性的驾驶策略。
与传统依赖高清纹理或 3D 重建的方式不同,X-Mind 构建了一种融合了鸟瞰图(BEV)布局与抽象驾驶先验的“认知画布”。该“画布”包含物理场景元素、动态交通信号灯状态、导航意图以及合规车速等关键信息。通过深度压缩自编码器(DC-AE),X-Mind 能将多帧的未来世界推演压缩至极少的 Token,有效过滤掉无关的纹理干扰,仅保留核心语义信息,从而解决了长上下文带来的计算瓶颈,并具备在车规级芯片上量产落地的可行性。对比实验数据显示,X-Mind 在轨迹预测精度上显著提升,尤其在复杂长尾场景下,安全性和合规性得到大幅改善;同时,其推理延迟极低,相较于使用原始图像或 3D 高斯溅射的方案,实现了效率的革命。

X-Mind 技术框架的推出,预示着小鹏汽车在自动驾驶领域的技术实力进一步增强。其“预见未来”的设想,有望在实际驾驶中带来更平顺、更安全、更具前瞻性的体验,尤其是在处理复杂交通场景时,能够显著降低人为干预的可能性,向更高级别的自动驾驶能力迈进。