对话元戎启行周光：“车位到车位”的智驾，依靠的是高精地图，是“缝合怪物”

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

“大模型经历了从专家系统到通才系统，再到真正强专家系统的阶段，智驾、机器人也会经历同样阶段。”这是元戎启行CEO周光对物理AI发展做出的判断。

他在电动汽车百人会期间对搜狐科技表示，ChatGPT就是通才，只有在语言领域实现通才，才能实现非常强的专才。“如果没有GPT-4这样的通才系统，也很难做出来o1这种专家系统。”

“物理世界也是一样，因此整个自动驾驶会跟着大模型走，会follow同样的范式。现在还是在弱专家阶段，我认为接下来要做通才，否则实现不了最后的强系统。”周光强调。

目前，很多车企都在追求L3自动驾驶。周光认为，L3更多是工程问题，但AI能力做得越好，工程难度会降低。“用以前的弱专家系统去做L3，可能需要非常大量的工程，需要千人团队，但用下一代的AI系统，可能只需要百人，体验可能也会更好。”

在周光看来，特斯拉的FSD V13是以大模型范式去做，领先国内一个代差，但国内优势在与本土的数据闭环，特斯拉没办法在中国采集数据。“我们也许能在中国率先把这个做出来，中国公司也有这个能力做出V13的效果。”

不过，他也提出一个值得思考的观察：特斯拉为什么没有强调要做L3，以及为什么没有做“车位到车位”的智驾功能？

对此，周光的解释是，国内做“车位到车位”依靠的是高精地图，是“缝合怪物”，技术层面没有价值，AI能力没有长进，但用户觉得有一定价值。“特斯拉不会为了取悦用户做，而是希望通过技术去解决，真正用AI的能力实现‘车位到车位’。”

周光认为，这里面更重要的还是AI能力上限的提升。他表示，元戎启行虽然有追求AI上限的愿景，认为做出物理世界AGI的意义和使命更大，但也会为了商业化，去满足市场的需求。

展开全文

“如果不考虑商业化，我认为就不应该有L3，应该直接像特斯拉，从L2尽可能追平L5，这是从纯AI角度来讲。”

周光认为，特斯拉这么做也是因为它在美国没有对手，但在中国这么卷的市场下，它可能也会做“车位到车位”。

为了谋求更高阶的智驾能力的突破，不少车企和智驾企业都开始发力端到端的自动驾驶大模型，甚至开始做集语言-视觉-行为为一体的VLA大模型。

周光解释，端到端就是所有东西都是靠神经网络来决策，而大模型天生就是端到端，不是以前的范式。

“现在大家都叫智驾大模型，喊口号谁都能喊。但今天的自动驾驶远没有到大模型时代，用大模型架构来做自动驾驶才叫进入大模型时代，现在是刚开始从专才往通才走。“

他表示，当全面进入大模型时代，采用了更新的架构，就可以享受Scaling law带来的优势。谁先能够进入智驾大模型时代，谁可能就能享受这个红利。但现在很多同行都是专家系统，因此所谓的规模优势并不存在。

他进一步解释到，要想实现自动驾驶的终极目标，必须要对普遍的物理世界有通用的认知，但现在的智驾系统除了可以理解车道线、车、人和部分障碍物，对物理世界的其它场景是零理解。

“按照现在的专家系统做法永远不行，一定得让系统通用化，让大模型对物理世界各类场景都能理解，实现通用能力是实现L5级自动驾驶必需的条件。”周光说，这来源于对AI的认知，这也是元戎企业不是定位智驾公司，而是一家物理AI公司的原因。

此前不久的英伟达GTC大会上，元戎启行发布了RoadAGI产品。周光表示，就是希望借此实现智驾从专家系统到通才系统的转变，计划VLA今年上车，预计会在超过10款车型上实现超20万辆的量产规模。

不过，在自动驾驶往大模型时代走的的过程中，周光也坦言，可能也会有走错路的情况，没有人能够100%对。

“每次关键技术的变化都会带来行业的变化，接下来可能还会是翻天覆地。一旦技术路线走错，今天市场所谓的排位就荡然无存。”他说。

周光表示，元戎启行会持续在物理AI领域突破，而智驾也许是物理AI第一个大规模落地的场景。“所以我们会不停地去做更好的AI，直到真正实现物理世界的AGI。”

“给我转人工，转人工”，AI客服把人逼疯