您的位置 首页 科技

对话元戎启行周光:“车位到车位”的智驾,依靠的是高精地图,是“缝合怪物”

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“大模型经历了从专家系统到通才系统,再到真正强专家系统的阶段,智驾、机器人也会经历同样阶段。”这是元戎启行CEO周光对物理AI发展做出的判断。

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

“大模型经历了从专家系统到通才系统,再到真正强专家系统的阶段,智驾、机器人也会经历同样阶段。”这是元戎启行CEO周光对物理AI发展做出的判断。

他在电动汽车百人会期间对搜狐科技表示,ChatGPT就是通才,只有在语言领域实现通才,才能实现非常强的专才。“如果没有GPT-4这样的通才系统,也很难做出来o1这种专家系统。”

“物理世界也是一样,因此整个自动驾驶会跟着大模型走,会follow同样的范式。现在还是在弱专家阶段,我认为接下来要做通才,否则实现不了最后的强系统。”周光强调。

目前,很多车企都在追求L3自动驾驶。周光认为,L3更多是工程问题,但AI能力做得越好,工程难度会降低。“用以前的弱专家系统去做L3,可能需要非常大量的工程,需要千人团队,但用下一代的AI系统,可能只需要百人,体验可能也会更好。”

在周光看来,特斯拉的FSD V13是以大模型范式去做,领先国内一个代差,但国内优势在与本土的数据闭环,特斯拉没办法在中国采集数据。“我们也许能在中国率先把这个做出来,中国公司也有这个能力做出V13的效果。”

不过,他也提出一个值得思考的观察:特斯拉为什么没有强调要做L3,以及为什么没有做“车位到车位”的智驾功能?

对此,周光的解释是,国内做“车位到车位”依靠的是高精地图,是“缝合怪物”,技术层面没有价值,AI能力没有长进,但用户觉得有一定价值。“特斯拉不会为了取悦用户做,而是希望通过技术去解决,真正用AI的能力实现‘车位到车位’。”

周光认为,这里面更重要的还是AI能力上限的提升。他表示,元戎启行虽然有追求AI上限的愿景,认为做出物理世界AGI的意义和使命更大,但也会为了商业化,去满足市场的需求。

展开全文

“如果不考虑商业化,我认为就不应该有L3,应该直接像特斯拉,从L2尽可能追平L5,这是从纯AI角度来讲。”

周光认为,特斯拉这么做也是因为它在美国没有对手,但在中国这么卷的市场下,它可能也会做“车位到车位”。

为了谋求更高阶的智驾能力的突破,不少车企和智驾企业都开始发力端到端的自动驾驶大模型,甚至开始做集语言-视觉-行为为一体的VLA大模型。

周光解释,端到端就是所有东西都是靠神经网络来决策,而大模型天生就是端到端,不是以前的范式。

“现在大家都叫智驾大模型,喊口号谁都能喊。但今天的自动驾驶远没有到大模型时代,用大模型架构来做自动驾驶才叫进入大模型时代,现在是刚开始从专才往通才走。“

他表示,当全面进入大模型时代,采用了更新的架构,就可以享受Scaling law带来的优势。谁先能够进入智驾大模型时代,谁可能就能享受这个红利。但现在很多同行都是专家系统,因此所谓的规模优势并不存在。

他进一步解释到,要想实现自动驾驶的终极目标,必须要对普遍的物理世界有通用的认知,但现在的智驾系统除了可以理解车道线、车、人和部分障碍物,对物理世界的其它场景是零理解。

“按照现在的专家系统做法永远不行,一定得让系统通用化,让大模型对物理世界各类场景都能理解,实现通用能力是实现L5级自动驾驶必需的条件。”周光说,这来源于对AI的认知,这也是元戎企业不是定位智驾公司,而是一家物理AI公司的原因。

此前不久的英伟达GTC大会上,元戎启行发布了RoadAGI产品。周光表示,就是希望借此实现智驾从专家系统到通才系统的转变,计划VLA今年上车,预计会在超过10款车型上实现超20万辆的量产规模。

不过,在自动驾驶往大模型时代走的的过程中,周光也坦言,可能也会有走错路的情况,没有人能够100%对。

“每次关键技术的变化都会带来行业的变化,接下来可能还会是翻天覆地。一旦技术路线走错,今天市场所谓的排位就荡然无存。”他说。

周光表示,元戎启行会持续在物理AI领域突破,而智驾也许是物理AI第一个大规模落地的场景。“所以我们会不停地去做更好的AI,直到真正实现物理世界的AGI。”

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://wtoor.com/21531.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部