行业聚焦
英伟达发布全球首个开源VLA 中国智驾公司该不该慌?
2025-12-11 10:56:46

转载|搜狐汽车·汽车咖啡馆
作者|胡耀丹
“英伟达要做智驾界的安卓系统”“英伟达掀了智驾公司的桌”“英伟达做慈善了”……
近日,全球AI芯片巨头英伟达宣布正式开源其最新自动驾驶VLA模型Alpamayo-R1,业界议论纷纷。
这是英伟达在汽车领域公开发布的首个智能驾驶大模型,也是英伟达全球副总裁、汽车事业部负责人吴新宙加入英伟达后,向外界交出的首份智能驾驶答卷。
更关键的是,它是全球首个面向智能驾驶的开源VLA模型。“开源”将其VLA架构,及对应的100TB大小数据集(包括美国、欧盟多国数据,不包括中国道路)释放在全球开发者眼前,可谓“慷慨解囊”。
英伟达正在奋力追赶智能驾驶系统的研发进度。其开源VLA的动作,不禁让人想起2025年初,同样走开源路线的Deepseek,凭借高性价比和高性能在大语言模型领域一炮而红。
同样是开源,同样是“追赶”。在智能驾驶应用层尚未打出声势的英伟达,能够复刻“后来居上”的道路吗?VLA被理想、小鹏、元戎启行等公司视作核心技术路线,当英伟达将VLA“开源”在了全世界眼前,中国智驾公司该不该慌?
01 开源VLA:利还是弊?
在智能驾驶技术的演进脉络中,VLA模型(视觉-语言-动作模型,Vision-Language-Action Model)与世界模型,已被视作驱动技术突破的两大关键路径。
高阶智驾领域,国内多个智驾公司与自研智驾的汽车厂商,均选择了VLA路线作为技术路径。比如,理想汽车、小鹏汽车、吉利汽车,以及最先在国内提出VLA研发方向的智驾公司元戎启行。
英伟达此次发布首个VLA模型Alpamayo-R1,意味着这家力图扩张汽车业务的AI巨头,也选择了VLA的技术路线,这也让VLA阵营迎来了重量级玩家的加持。
公开资料显示,Alpamayo-R1基于全新的“因果链”数据集训练。每一段驾驶数据既明确车辆“做了什么”,更阐释“为何做出该决策”。英伟达公布的数据显示,Alpamayo-R1在复杂场景下的轨迹规划性能提升了12%,近距离碰撞率减少25%,推理质量提升 45%,推理-动作一致性增强37%。
“VLA是智驾进入大模型范式的起点,随着时间的积累,VLA会远远好于CNN架构的端到端1.0。”今年8月,元戎启行CEO周光在接受搜狐汽车专访时说。(详见《对话元戎启行周光:VLA代表智驾进入GPT时代 AI规则下我们胜率更高》)
业内稀缺的VLA模型,被英伟达公之于众。这可能带来短期内技术暴露的风险,也可能影响当下以VLA为技术路径的智驾团队(包括英伟达在内)的稀缺性和商业价值。
但实际上,开源一直以来都是英伟达在AI领域的长期策略。
“玩AI的,开源是常态。”同济大学汽车学院教授朱西产对搜狐汽车表示,英伟达智驾模型及数据开源,目的还是强化CUDA生态在汽车智驾领域的地位。
公开资料显示,CUDA是NVIDIA 的加速计算平台,为应用程序提供利用GPU算力的软件层。其于2006年推出,至今为止已经形成一个庞大的生态。而在CUDA这一“底层基础设施”之上,英伟达又在应用层打造了Nemotron。Nemotron是一系列开放模型、数据集和技术,专为高级推理、编码、视觉理解、智能体任务、安全性和信息检索而设计,以开源形式提供。
从GPU,到利用GPU算力的软件层,再到提供一系列开源模型的应用层,英伟达正让外界形成“用AI必选Nemotron,用 Nemotron则要依赖CUDA,用CUDA 优先选择 NVIDIA GPU”的路径依赖,以生态巩固其在AI领域的行业地位。
可见,撬动英伟达生态的入口,正是Nemotron层的开源策略。而如今,其在智驾领域延续了这一策略。
“通过开源,一是可以压制新的创业融资,二是激发车企自研(智驾系统)的信心,维护智驾芯片的霸主地位。”朱西产对搜狐汽车表示,智驾芯片分为特斯拉式的芯片自研模式和英伟达式的生态模式。如果更多车企采用自研模式,英伟达就输了。
基于此,围绕英伟达硬件开源的VLA技术,既能够助力“非自研芯片”智驾团队的技术进步,也能将更多智驾团队与英伟达硬件绑定。
这或会对国内智驾格局形成扰动。对国内身处第二梯队的智驾公司如轻舟智航、四维图新、易航智能等而言,“AI学霸”英伟达投注大量人力、物力交出的答卷,可能成为其技术路线探索道路中的指路灯。
不过,这并不意味着第二梯队智驾公司能够轻松“逆袭”。“我感觉不会有太大的颠覆效应。第一这个模型没有被量产验证过,并不知道实际水平怎么样;第二,即使模型非常好,仍然需要非常多的数据训练工作,非常非常烧钱。腰部公司有没有钱去烧,也很难说。”一名不愿具名的企业内部人士对搜狐汽车说。
比较有意思的是,在今年11月的小鹏科技日上,小鹏汽车宣布,小鹏第二代VLA将面向全球商业伙伴开源。据悉,该模型可跨域驱动汽车、Robotaxi、机器人、飞行汽车。12月8日,地平线也发布了两大具身智能开源模型:具身智能小脑基座模型HoloMotion、具身智能大脑基座模型HoloBrain。
在这背后,通过开源,围绕芯片、技术架构形成生态的策略,有希望成为物理AI世界的一大趋势,更将为一批新兴企业明晰技术路径。
02 智驾没有“躺赢捷径”
“你不杀伯仁,伯仁却因你而死。”
英伟达开源VLA利好了其AI生态,会否影响现有以VLA为核心技术的中国智驾团队/公司?
答案是,影响并不大。
首先,英伟达自身并未实现VLA技术的商业化落地,开源的技术架构商业化价值有限。“英伟达也没有搞出来一个能用的VLA,开源也就是把自己的一些方法论做个示范。”一名不愿具名的行业人士对搜狐汽车说。
而在智驾领域,“发论文”和“做落地”之间有着天壤之别。
12月9日,2025地平线技术生态大会期间,岚图汽车科技股份有限公司总经理助理兼新能源技术高级总监黄敏表示,今年岚图汽车面临的挑战,一是新品牌智驾数据积累不足,二是城区NOA难平衡通行效率与用户安全感。
元戎启行CEO周光表示,过去一年,元戎的智驾系统量产能力大幅爬坡,挑战集中在工程端多车型大规模交付的细节问题,以及数据飞轮驱动端到端系统优化的应用难题。此前在接受搜狐汽车专访时,周光也曾表示,技术是1,商业化是0。如果只有1,后面没有0去加持,永远都是只是一个1。工程化能力有了,才可能去补齐商业化。
可见,在当下的智驾公司眼前,工程落地的重要性并不逊色于架构先进性。
其次,开源技术虽然在透明度、开放性上远胜闭源,但在安全性、稳定性等汽车最重视的能力上有一定劣势。
“汽车行业的数据主权、信息安全和功能安全要求极高,远超消费电子。汽车数据涉及大量用户隐私和车辆核心信息,保密要求严格,绝不可能通过开源来获取或共享数据。”今年6月,在接受媒体采访时,无锡车联天下信息技术有限公司创始人、CEO杨泓泽说。
值得一提的是,英伟达开源的数据集包含来自25个国家和2500多个城市的计划数据采集驾驶活动所记录的总计1727小时的驾驶数据,但均来自美国、欧盟,不包括任何一帧中国道路数据。
此外,杨泓泽表示,若汽车厂使用其他组织的开源技术,担心对方后续不再开源,或开源的不是最新技术。这种不确定的生态和商业模式,让人难以放心使用,短期内,即便有人尝试,也难成主流。
事实上,目前智驾领域也存在百度Apollo等开放平台,但总体来看,由于深度耦合的软硬件需求和安全考量,开源协作要求更高,迭代周期更长,智能驾驶社区影响力和活跃度远不及LLM。
在GitHub网站上,以 "LLM" 为搜索词,代码仓库(通常反映开源项目规模、活跃度)为30万,而以“autonomous driving”为搜索词,代码仓库不到1万,二者之间差距接近40倍。
图源:汽车营造社
最后,开源、闭源各有优劣,VLA模型与VLA模型之间也各有特点,难以形成“碾压”优势。
在LLM(大语言模型)领域,Deepseek之所以能后来居上,与开源模式有关。开源快速降低推理成本,带来了世界各地开发者的参与,从而形成活跃的技术生态。
Meta首席人工智能科学家杨立昆(Yann LeCun)表示,DeepSeek 的成功带来的最大启示是保持 AI 模型开源的重要性,这样每个人都能从中受益。他表示,这并不是中国的人工智能“超越美国”,而是“开源模型战胜了专有模型”。
但是,ChatGPT并未因Deepseek的出现而倒下,即便后者相差不大的性能参数带来了巨大的危机感。
反映到智驾领域,英伟达开源VLA产品并非完全成熟、可落地。即便其凭借开源形成生态,在“众人拾柴火焰高”的助力下推出能与中国智驾公司媲美的、安全稳定的VLA产品,也难以具备“碾压”优势。
“就像你问Deepseek跟ChatGPT有什么区别?它们都是基于GPT架构的大模型,但它们之间肯定有区别,每家的VLA模型都不一样。”周光曾对搜狐汽车说,比如元戎启行VLA的特点,就是“防御性驾驶”。
将英伟达的开源动作放回智能驾驶产业链,一个更清晰的答案正在浮现:中国智驾公司不必“马上慌”,但必须“加速跑”。
智能驾驶没有捷径,VLA胜负的最终判别,仍然落在真实道路表现与量产交付上。
