您的位置 首页 科技

对话面壁智能李大海:知识密度定律和Scaling Law,会共同影响大模型的发展

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“我们认为未来汽车一定会变成一个超级智能体,每个人车上都会有一个贾维斯。”面壁智能CEO李大海在电动汽车百人会期间对搜狐科技表示。

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

“我们认为未来汽车一定会变成一个超级智能体,每个人车上都会有一个贾维斯。”面壁智能CEO李大海在电动汽车百人会期间对搜狐科技表示。

他提到的‌贾维斯是科幻电影《钢铁侠》里一个具有高度智能和情感能力的AI系统,陪伴了钢铁侠半生,成为他不可或缺的伙伴。

现在,面壁智能希望把这样的贾维斯带进智能汽车。百人会期间,李大海发布纯端侧智能助手cpmGO(小钢炮超级助手),希望为各种终端打造端侧大脑。

对于大模型未来的发展,李大海对搜狐科技表示,云端和端侧模型发展重心不同,创业公司要选择认知密度跟人才密度有优势的领域,不要选跟大厂拼资金的领域。

车企接入DeepSeek是端侧AI,不等于端侧模型

谈及在汽车领域的布局,李大海表示,面壁智能主要是做端侧大脑,同时要跟小脑互动。“智驾就是汽车的小脑,端侧大脑主要感知环境和用户意图,把这些用户意图转化为让小脑理解的指令,让小脑执行。”

他强调,面壁智能重点做的是座舱,最终座舱一定要跟智驾协同,未来用户指令应该包含对智驾的指令,但不会去碰智驾。目前,该公司正在与多家汽车客户合作,第一款车有望在今年三季度正式上市。

此前,DeepSeek爆火之后,不少车企纷纷宣布接入。李大海认为,这涉及两个不同的概念,端侧AI和端侧模型,这两个有着本质区别。

他解释称,端侧AI指的是在终端上把AI落地,接入DeepSeek就是这种方式,速度最快,而端侧模型则专指完全在本地进行计算和运行的大模型。

“与云侧模型相比,端侧模型具有不可替代的优势——不仅能有效避免数据上云、解决用户数据和隐私安全的顾虑,还能够突破网络环境的限制。”

展开全文

李大海进一步强调称,用户隐私和可靠性需要通过端侧模型实现,纯云端做不到。“但云跟端要协同,端侧要把该做好的事情做好,包括理解用户,而云端不应该对用户有太多的理解,对用户越多的理解,就意味着用户隐私信息越多的暴露,这是一个硬币的正反面。”

随着智能汽车竞争越来越激烈,车企也需要谋求差异化和个性化。对此,李大海对搜狐科技表示,智能座舱的差异化是点状探索的过程,最终这些点状探索会越来越密集。

“就像一块石板上,开始下雨的时候只有小的雨点,但雨下得越来越大,最后整个石板都会被打湿。”他形象地比喻到,这些创新探索最终连成一片后,智能化没有太多差异化可言,这是未来的终局。

目前,汽车智能座舱主要通过语音交互,被动完成用户下达的指令。李大海认为,随着模型能力越来越强,未来汽车会成为超级智能体,车上的贾维斯能通过环境感知提前完成用户想做的事情,最终成为用户离不开的超级智能体(Agent),这是智能座舱的演进方向。

同时,李大海提到,大模型和Agent是两位一体,大模型就是Agent,这和西红柿叫番茄、马铃薯叫土豆没有本质区别。“我们在端侧就把小钢炮送去上班了,它就是Agent。”

他进一步解释称,Agent体系要想把场景做好,模型作为引擎的推动力非常重要,如果模型的能力不够,整个Agent系统的效果做不出来。

“任何Agent应用一定要具备优化模型的能力,我们叫一杆子捅到底,就是从底层模型针对场景做整体的优化,这才是真正落地的方式。李大海说。

大模型更新非常快,知识密度和Scaling Law都会发挥作用

目前,大模型的技术进展仍在继续推进,最近DeepSeek、OpenAI、谷歌等公司都在基础模型能力进化方面继续更新,这意味着AI技术的竞争还没有走到终点。

“大模型领域的发展不是按年计也不是按月计,甚至不是按周计的,因为每天都有非常多的论文,有非常多的想法,更新非常快。”李大海对此也深有感触。

目前,面壁智能的小钢炮系列模型也在往多模态方面进化,此前还提出“大模型的知识密度”概念。这个概念是说,当训练效率越高的时候,就能把更多数据里面的知识都压缩到模型参数里面,大模型的知识密度平均每一百天提升一倍。

“过去大概两年的时间,OpenAI整个API成本下降了200倍,背后其实就是在遵从大模型的知识密度定律。”李大海认为,知识密度定律是和Scaling Law会共同影响大模型未来的发展。

自去年以来,大模型的Scaling Law陷入瓶颈,面临数据规模和数据质量的问题。但随着DeepSeek等模型的进步,预训练和推理的能力拓展越发受到关注。

“预训练的本质是对于静态知识的建模,后训练的本质是对于人的思维方式的动态建模,这两个建模能完整地把人怎么去理解和思考世界的过程都能够做好。”

李大海认为,知识密度定律在这两个方面都有效,“我们相信做出同等好的思维水平的模型,只需要一百天用一半的参数量就能达到,这对预训练和后训练同样有效。”

因此,对于大模型的未来发展,李大海认为大模型会越来越强、越来越小,只有这样成本才能越来越低,才能够在更多的场景里面去落地。

不过,他对搜狐科技表示,云端大模型和端侧大模型的发展重点会有明显区别。

具体来说,云端大模型会越来越强,追求全知全能,能做复杂工作,比人的能力上限和效率都要更高更强;端侧强调隐私和可靠性,所以重点要做好灵敏的感知,然后做出符合感知的决策,从而去敏捷行动,这是最重要的事情。

“在这个基础上,端侧还应该做好的是越来越懂用户,但它不需要全知全能。”李大海说,面壁智能的愿景就是打造未来端侧大脑,希望它能部署所有终端。

除了汽车领域,面壁智能还在PC、手机、机器人等领域布局。“手机、汽车全球出货量非常大,同时是影响力非常大的终端,都是非常好的场景。”李大海表示,相对来说,汽车更能够突出Agent和模型的价值,手机在虚拟信息能够更懂用户,各有各的优势。

在机器人领域,面壁智能已经和人形机器人公司加速进化达成合作。“他们新出厂的机器人会原装配置面壁小钢炮,支持全模态。”李大海表示。

在去年底完成的新一轮融资中,李大海表示,大模型开始进入真刀真枪的比拼阶段,从大跃进转向持久战。

这场持久战中,大厂和创业公司将在技术、商业化等层面展开全面竞争。去年6月,原为知乎CTO的李大海转向全面聚焦于面壁智能的工作,经过近一年的创业,李大海也在持续摸索创业公司打法。

“创业公司的优势主要在于认知跟能力,我们要有足够高的认知密度跟人才密度。”李大海说:“我们在资金密度上不可能跟大厂比,不会选一个最后是跟大厂拼资金的领域。如果进入这样的领域,任何一个创业公司最后的结果都不会好。”

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://wtoor.com/21371.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部