当前位置: 首页 > 厂商资讯 > 正文

从小模型到大模型:周光谈自动驾驶的下一代技术路径

2026-04-12 19:20:34

  2026年4月,在2026智能电动汽车发展高层论坛上。元戎启行CEO 周 光出席论坛并发表主题演讲,以下为演讲全文。

从小模型到大模型:周光谈自动驾驶的下一代技术路径

  大家好,我是元戎启行CEO周光。今天我分享的主题是:基座模型,让认知再次进化。

  过去几年,自动驾驶每年都有明显进步。但随着场景复杂度提升,传统小模型方案的提升变得越来越困难。我们经常看到所谓的“跷跷板效应”:同一套系统,早上跑得好,中午可能变差;在上海表现不错,换一个城市就不行。

  这些现象的本质,是小模型智驾自身能力的困境。要真正解决问题,必须全面走向大模型、走向基座模型。

  智驾下一阶段的关键,不仅是感知能力或简单的端到端,而是整体认知能力的进化。基座模型是实现这一升级的核心路径。在大洋彼岸,无论是特斯拉还是Waymo,已经完成了这一转变——用基座模型驱动整个研发。

  从无图到VLA,行业在不断进步。但在去年我们推出VLA的时候,大模型本身还不够成熟。2025年,多模态领域没有明显突破;直到今年年初,随着Gemini等模型的发布,多模态能力才上了一个大台阶。

  最近,国内头部大模型公司也开始布局自动驾驶,而且是由多模态负责人亲自带队。原因在于:在物理AI的场景中,只有汽车能提供如此高质量的数据。对大模型公司来说,做自动驾驶不只是为了盈利,更是为了通过多模态基座模型验证物理AI的能力。

  先分享一组我们的真实数据。

  截至目前,元戎启行已经累计交付近30万台搭载城市NOA功能的量产车。过去一年,累计行驶里程超过13亿公里,用户使用时长超过4480万小时,避免前向潜在碰撞事故14.1万次,避免后向潜在碰撞事故4.7万次。这些数据验证了辅助驾驶在日常出行中的安全价值。

  从行业竞争格局来看,城市辅助驾驶正在快速集中。2025年第四季度,行业前三强占据了99%的第三方NOA市场份额,元戎以15.51%的份额稳居第一梯队。随着合作车型持续落地和交付规模扩大,我们的市场份额还在稳步提升。最近一款新车上市,日订单达到数千台,这意味着我们的城市NOA方案正在被越来越多车企和用户选择。

  但在规模化落地过程中,我们也看到一个越来越明显的行业现象:2025年,中国辅助驾驶解决方案的市场规模超过1200亿元,量产芯片算力提升至750 TOPS级别,但城区NOA用户黏性大概是在20%-30%区间,城区NOA渗透率仅15%左右。

  行业面临一个明显的“落差”,即规模和投入不断增加,但消费者并没有把城市辅助驾驶作为日常工具。如何让辅助驾驶从“可用”走向“爱用”乃至“依赖”,是下一阶段必须解决的问题。

  这背后是技术原因。2024年,端到端技术带来行业快速进展,元戎也是中国首个量产落地端到端的公司。2025年,头部玩家增长放缓,第二梯队追赶加速。最本质的原因在于:今天量产的小模型智驾参数量非常小,多数在1B以下,甚至0.1B以下,运行算力典型在100-200 TOPS。

  这类小模型以卷积为主,只有少量Transformer架构。其表现就是:版本不断迭代,某个版本优化了某些场景,下一个版本可能又退步了。反复修补、不断迭代,但没有本质提升。

  2025年,元戎成为国内首家推出VLA模型辅助驾驶方案第三方提供方。VLA深耕多模态,而多模态的真正突破发生在今年年初Gemini、Seedance等模型的发布,让多模态能力上了一个台阶,这一技术突破会快速惠及机器人和自动驾驶等领域。

  不过,要解决小模型的“跷跷板效应”,必须从小模型范式转向大模型范式,用Scaling的方式系统性提升能力。元戎选择从模型Scaling和数据Scaling两个方向同步推进,打造了40B(400亿参数规模)的基座模型。

  本质上,当前辅助驾驶公司只做三件事或者三种角色:Driver、Analyst和Critic。具体而言,Driver负责视觉输入生成驾驶动作;Analyst对关键场景进行理解和分析;Critic从安全与合理性角度评估驾驶行为。基座模型不仅会开车,还会理解为什么这样开,并评估是否开得更好。过去我们只训练Driver,而现在,基座模型统一了这三种能力。据我们了解,Waymo和特斯拉已经实现了这一架构。

  所有辅助驾驶公司的工作都应该沉淀在基座模型里,每一步的信息熵都留在模型中。这意味着驾驶系统从过去的“执行系统”升级为“认知系统”。过去半年到一年,我们花了大量时间重构这套体系:它不再是传统自动驾驶范式,而是完整的大模型范式。

  基于基座模型,我们重构了数据闭环。传统流程大量依赖人工,从问题发现、归因分析到数据挖掘与标注,周期通常需要5天以上。引入基座模型后,通过AI Orchestrator实现全流程自动化,周期缩短至约12小时,效率提升近10倍,而且每个步骤都沉淀了模型经验,让训练效率更高,持续提升辅助驾驶能力。

  通过基座模型的技术赋能,我们还可以支持多种产品形态。基于我们的基座模型,针对100 TOPS算力提供经济型辅助驾驶方案,针对500 TOPS算力提供高性能方案,针对上千TOPS算力用于Robotaxi场景。所有产品共享同一基座模型,所有真实道路的海量数据不断反馈给模型,形成数据飞轮。目前我们有超过30万辆量产车、累计里程超过13亿公里,这些都将推动能力持续提升。

  然而,真正的难点在于:如何让大模型变得更好,而不是让700 TOPS的芯片跑出的效果和100 TOPS差不多。大模型好了,蒸馏出来的小模型自然厉害。

  回顾我们公司的发展,元戎一直在国内保持领先:2023年,我们在国内首个发布不依赖高精地图的方案;2024年,推出首个量产端到端模型;2025年,我们是第三方当中第一个推出VLA模型;2026年,我们又率先基于基座模型实现范式跃迁,从小模型时代进入大模型时代。

  今年可能是多模态进展的元年。真正的智驾竞争,不再来自同行,而是来自大模型公司的降维打击。大模型公司在多模态领域取得巨大突破后,将能力落地到自动驾驶场景。毕竟,多模态本质上就是预测物理世界下一刻会发生什么,这仅仅是一步之遥。

  2026年,元戎启行将迈向新征程。首要目标是实现超过100万辆城市NOA的量产交付;安全方面,将MPCI指标提升至1000公里以上,这依赖基座模型能力和AI Safety架构;用户体验上,将用户高频使用率提升至50%以上,让辅助驾驶从“可用”真正走向“爱用”。下一步,我们将挑战万公里级的MPCI,实现Robotaxi的规模化应用。

  回到辅助驾驶的初心:我们相信,技术的最终目标是让出行更加安全、可靠。元戎希望通过持续创新,让辅助驾驶成为千家万户日常出行的一部分,成为未来物理AI的基础设施。

  接下来在北京车展上,我们的首席科学家阮翀将进行公开演讲,系统分享公司在基座模型方向的最新技术进展与核心成果。以前这些内容多由我本人来负责,今后这一部分将交给首席科学家来替我分担。

  欢迎大家来到车展现场,共同见证辅助驾驶全面迈向多模态大模型的时代。

  谢谢大家!

【独家稿件及免责声明】本网注明转载文章中的信息仅供用户参考。凡注明来源“运输人网”的作品,未经本网授权均不得转载、摘编或使用。联系邮件:master@yunshuren.com

点击关键字阅读相关文章: 文章来源:网络
阅读
收藏 收藏

评论

评论内容最少2字,最多200字
check in
同步到在路上
report
图片
热门活动
品牌车系用途
推荐品牌
精选车系
说说你的看法 说说你的看法...
join favorite