出品 | 搜狐科技
作者 | 梁昌均
这两天,从媒体圈到资本市场,一款名为Manus的智能体(Agent)产品突然爆火,多个概念股掀起涨停潮。
在DeepSek、宇树科技等引发的技术创新轰动下,Manus背后的中国年轻创业团队同样被冠以宏大的AI突破叙事,甚至有人称其为又一个ChatGPT时刻或DeepSeek时刻。
在二手交易平台,Manus邀请码价格达到上千元或上万元,有的炒到10万元,甚至还有人报价8000万,不少社交平台和交流群都被“求邀请码”刷屏。
这款号称是“全球首款通用智能体”的产品,到底有着什么魔力?饥饿营销、套壳质疑背后,是否具备技术壁垒和产品护城河?李彦宏、黄仁勋等大佬看好的智能体会迎来爆发吗?
首款通用智能体,击败OpenAI的Manus体验到底如何?
筛选简历、研究房产、分析股票、旅行规划、报告撰写、PPT制作……Manus官网上展示了50多个可以帮用户完成的各种复杂任务。
让不少人颇为兴奋的是,Manus又像DeepSek那般,再次击败了更早布局智能体的OpenAI。
官网显示,GAIA基准(用于评估AI助手实际问题解决能力)的三个难度级别,Manus都实现最先进的(SOTA)性能,大幅超过OpenAI的Deep Research。
从示例来看,Manus在接到用户指令后,可以直接操作电脑,完成报告撰写、表格制作等任务。同时,还会把文档阅读、网页浏览、运行代码等执行过程,通过虚拟机图形用户界面在右侧对话框进行展示。
比如,在分析特斯拉股价时,展示了收集信息-分析报表-市场情绪-投资报告等思考的全过程。这些过程看起来跟人类解决问题的思考和行动非常相似,根据指令需求都能自助完成。
“当其他AI只是在生产想法,Manus是交付成果。”Manus AI联合创始人兼首席科学家季逸超表示。
从业内反馈来看,相较ChatGPT、Claude等仅能提供建议的聊天类产品,Manus的最大不同是可以直接交付成果,如报告、PPT等。“它真的可以给人干活,可以取代实习生了。”
同时,相较专用Agent,Manus不再局限于单一任务和领域,而是能够理解复杂指令、自主学习,能够完成跨领域的复杂任务。
此外,Manus采用了云中异步的工作方式。简单说就是,在等待当前任务执行时,可以执行其它任务,实现多任务并行,直接关闭电脑也不会影响任务进程。
多位试用者向搜狐科技表示,Manus的产品交互体验优于同类产品,会清晰地展示任务执行逻辑,对用户的意图识别和推理过程都不错,中间输入新的指令,也不会中断任务。
有体验者还观察到细节,在Manus遇到无法解决的问题时,还会向用户发出求助,比如输入登陆密码、验证码,或者选项太多会先让用户做选择,然后再继续完成任务。
不过,对于比较复杂的任务,Manus要跑1个多小时,甚至好几个小时,效率有待提高,有时还会出现bug卡住,无法顺利运行交付。
此外,由于底层模型固有的幻觉,以及搜索的不准确性、不完整性等因素,最终输出的内容准确性、完成度和用户满意度还有待完善。
在应用场景方面,Manus目前聚焦在信息整理范围,而没有触及到现实的物理世界。此前,国内不少企业都展示了点咖啡、发红包的智能体功能。
因此,有观点认为,Manus难以称得上是一款通用的智能体产品。
“通不通用要看标准,标准低可能就通用,高的话就都不通用了。除了基准测试,更关键的还是要看用户体感。”国内某AI独角兽业务负责人王伟对搜狐科技表示。
当然,更多的吐槽是邀请码太少,二手交易平台邀请码更有人报价8000万。初期各种不吝赞美的报道,拉高了市场预期,但实际使用用户有限,这也让Manus面临饥饿营销的质疑。
Manus AI合伙人张涛对此表示,从未开设任何付费获取邀请码的渠道,从未投入任何市场推广预算,内测期间系统容量有限,将优先保障现有用户的核心体验。
Manus到底有没有技术壁垒?套壳算不算创新?
Manus取自拉丁文mens et manus(头脑和手),这也代表了Manus团队的理念,即让知识不仅存在于头脑之中,还要通过手应用到实际生活,从而对世界产生有益的影响。
这个过程,Manus借助了多个技术。有技术人士认为,Manus的本质是Virtual Machine(虚拟机)+ Compute Use(计算机调用) + Artifacts (生成物)+ Multi-Agent(多智能体)。
这其中的关键是多智能体架构,其运行在独立的虚拟机中,规划、执行和验证三个子模块分工协作,并由多个独立模型分别解决不同的任务,从而实现对复杂任务的处理。
从公开信息来看,Manus模型采用了美国AI独角兽Anthropic的Claude模型和阿里通义的Qwen模型,其中Claude负责输出,Qwen负责调度。
从底层模型和技术组成来说,Manus基本是站在前人的肩膀上。虚拟机早在计算机领域广泛应用,Compute Use和Artifacts都不是Manus的首发,Anthropic的Claude此前就已推出这两项功能。同样,多智能体也不是新颖的概念和应用。
“从实际结果看,Manus能实现的更多,包括底层的Claude也能进一步通过生成代码解决问题。”王伟对比自家智能体后表示。
这也导致Manus爆火后面临模型套壳、“缝合怪”、没有技术壁垒的质疑。
有开发者就提到,Manus的自主规划能力,是基于现有大模型的调用,并未有底层技术的突破。例如,在股票分析案例中, Manus仅通过调用雅虎金融API获取数据,再借助Python脚本生成可视化图表,本质仍是工具链的拼接。
当然,也有观点认为,套壳到极致就是创新、就是胜利。其实,不少AI应用产品都是套壳,但套壳并非没有价值,关键看能否满足用户需求,更好地解决用户问题。
“创新得看‘大家知道但还没发布’,还是‘大家不知道’。DeepSeek 能做出大家先前意想不到的成果,比如通过纯强化学习就让 R1-Zero 获得了反思能力。Manus更多的是比别人快,有其它厂商也在研相似产品,但它是第一个发出来。”王伟表示。
因此,严格来说,那些把Manus视为下一个DeepSeek,或是将Manus和DeepSeek并列为中国AI技术创新突破的论调,可能犯了逻辑上的错误——DeepSeek本质是技术主导,而Manus则是产品主导,评判的标准并不一样。
在王伟看来,Manus本身是产品,不是模型,不会有很多技术上的创新,但是把现有技术组装好,也能显著提升解决问题的效果。
他还提到,Manus只是代表了做智能体的一种路线,也可以不用虚拟机去做。“智能体如何正确解决一个问题,现在还存在很大分歧。”他以查询阿里股价为例,介绍了四种方式及其优劣。
目前,Manus的同类型产品还有Flowith、Mgx等。在王伟看来,Manus算比较成熟,在产品设计和工程构建上花了很多心思。如果没有之前的积累,从零去追得花三个月到半年时间。
这跟Manus团队背景分不开,其创始人肖弘,是连续创业者,此前开发了企业微信SaaS工具微伴助手和壹伴助手,后来推出AI浏览器插件Monica,实现上千万用户和盈利。
肖弘的创业伙伴、Manus AI产品合伙人张涛先后在字节跳动、光年之外等负责产品;首席科学家季逸超则是Magitech Labs创始人,开发的iOS浏览器“猛犸”曾获MacWorld特等奖。
可见,Manus主创团队基本是以产品为主,并不是聚焦底层技术,Manus符合团队基因。但或是正因如此,这也导致了Manus的护城河并不高。
有观点认为,Manus的能力边界取决于基础模型本身,随着大模型能力的进化,其能力会被大模型内化掉。在基础模型没有突破前,这类产品的价值有限。
搜狐科技也不止一次看到过这种观点:字节这种大模型厂商很快就能做出来类似Manus的产品。
实际上,Manus在发布不到两天后,已有开发者至少复现了两款Manus 开源版产品——开源平台CAMEL AI 的OWL项目,以及MetaGPT团队花了三个小时复刻出OpenManus。
Agent商业化元年,为何国内外都看好智能体?
客观地讲,Manus虽然不是类似DeepSeek的技术创新突破,但它通过工程组合优化,进一步优化了智能体产品的体验,一定程度打开了对智能体产品的想象空间。
不过,至于它是否是智能体应用的ChatGPT时刻或DeepSeek时刻,可能还有待商榷。
这次的意外爆火,也超出Manus团队的预料。张涛发文称,Manus还是襁褓中的小婴儿,离正式版想交付的体验还差很远,模型幻觉、交付物友好度、运行速度等还有很大提升空间。
Manus的爆火,也反应出业内对真正好用的智能体产品的期待。Manus团队还需在产品上下更大的功夫,有报道称其将开启新的融资。
目前,国内外普遍都认为,2025年会是智能体商业化元年,并被视为大模型超级应用的突破点,不少公司都在布局智能体。
今年初的CES上,英伟达发布了基于Llama的智能体服务模型。黄仁勋认为,智能体是新的数字劳动力,智能体时代已然到来,有望成为万亿级的机会。
OpenAI年初推出其首款AI智能体Operator,随后2月,又推出面向深度研究领域的智能体Deep Research功能,其由o3模型支持,并计划扩展数据源和结合Operator执行复杂任务。
“我们相信2025年,会看到第一批AI智能体加入劳动力大军。”奥特曼表示,智能体将给AI领域带来全新变革,改变AI的应用模式和发展方向。
最新报道称,OpenAI还将推出一款“博士水平”的智能体,能够处理学术研究和软件开发领域中的复杂任务,每月收费可能在2000美元到2万美元之间。
“智能体是AI应用的最主流形态,即将迎来爆发点。”李彦宏在去年底表示。目前,百度文心智能体平台已吸引超80万开发者,其它大厂肯定也不会错过智能体的机会。
独角兽也在跟进。智谱去年底就推出智能体AutoGLM,并在端侧落地。搜狐科技获悉,智谱将会发布智能体在信息处理领域的更多功能。
阶跃星辰CEO姜大昕认为,智能体爆发的两个必要条件——多模态和慢思考都已实现,智能体具备的能力会从简单任务、组合任务、复杂任务,向主动发起任务、情感陪伴等升级。
Manus的火爆或很难持续,但也给创业者不少启示。Manus团队提到,初创团队具备更高的敏捷性和决策速度,跑过了大公司的惯性,从而把握了3个月的战略窗口期。
Manus坚持的“Less Structure、More Intelliengence”的理念,即用更少的规则程序,给予AI更多自主权,从而提高产品智能,这种非共识同样值得借鉴。
他们还提出了新的衡量AI产品成功的指标,看 AHPU(Agentic Hours Per User),用来衡量每个用户使用了多少Agent时间,摆脱了传统看DAU的互联网模式窠臼。
目前,Manus单次任务成本约2美元,低于OpenAI的10美元。但动辄半小时,甚至数小时的运行,意味着整个过程算力消耗不会低。基于新指标,或能探索出与之匹配的商业模式。
无论如何,智能体已是行业共识,永远值得期待的是下一个“Manus”,从而真正地把智能体带入我们的日常。
(应受访者要求,王伟为化名)