盖世汽车获悉 日前,小米汽车正式推出Xiaomi Auto World Model全新框架,将三维重建与视频生成进行深度耦合。与传统“重建+生成”简单串联的路径不同,该框架让两者在结构上互相约束:重建侧提供几何锚点,为生成“打地基”;生成侧补全未观测区域,为重建“扩边界”,共同抑制长时序漂移。
世界模型被视为辅助驾驶的“大脑预演系统”,能够基于历史与当前观测,预测环境下一步演化,帮助车辆应对暴雨、落石、逆行等低概率高危场景。此前行业两条主流路线——重建与生成(能预测但易漂移)——各自存在短板。小米的一体化架构尝试将两者优势融合。
在技术实现上,重建模块WorldRec采用稀疏三维锚点表征,替代传统逐像素稠密高斯方法,通过多视角多时刻特征聚合与可见性加权融合,实现10秒视频重建仅需10秒。生成模块WorldGen经两阶段训练,仅需4步去噪、0.19秒生成一帧,支持最长1分钟视频,可模拟罕见动物闯入、极端天气等长尾场景。
据小米公布,该框架在Waymo、nuScenes等主流基准测试中全面取得SOTA。其中WorldRec在Waymo数据集上PSNR达28.48,超出此前最佳方法;WorldGen在nuScenes上FVD达64.97,单视角生成速度较同类自回归方法快约5.6倍。
目前该框架已在小米汽车三大场景落地:合成数据生成、仿真测试(闭环复现真实事故)、辅助驾驶学堂(已上线全车型实景模拟功能)。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
预售13.98万起 北京现代MUFASA定名为沐
日前,车质网从北京现代官方获悉,旗下全新紧凑型SUV——北京现代...
既然无法避免内卷,那么大家一起卷起来。因此可以看到,越来越多的平...
农夫山泉2022年全年营收332.39亿元 同比
3月28日,农夫山泉公布了2022年全年业绩:营收332.39亿...
峰仔食品第三代产品全新发布 做江南特色点心的传星
作为浙江桐庐一带的特色小吃,酒酿馒头近几年迎来发展新势头,当地越...
上市价159元:魅族iPhone14系列PAND
魅族PANDAERiPhone妙磁壳自由金属系列上市售价139~...
盈康生命旗下医院成为国家心血管病中心肺动脉高压专
近日,由运城市医师协会主办,盈康生命旗下生态成员山西盈康一生总医...