Agent拐点:新物种正在诞生
本文来自微信公众号:闵蕾,作者:闵蕾,头图来自:AI生成
一、七个AI员工教会我的事
最近OpenClaw爆火,各行各业的朋友来问怎么用,技术圈的同学也在问“为什么是龙虾这么火?”
作为一个深度用户和AI从业者,我想聊聊真正深度使用之后的思考,以及对Agent的一些判断。
先说使用情况:2月初我开始部署OpenClaw,到现在一个多月,消耗了20多亿Token,最近一周日均1亿多。结果是:7人AI团队在稳定运行——管家协调全局,产品经理梳理需求,工程师开发维护网站,分析师出行业简报,编辑写内容,运营跑推广,助理处理杂事。不是单点解决了几个问题,而是像一个真正的组织一样,跑通了完整的业务闭环,并且创造了收入。
记得某天早上醒来,看到第一笔订单通知时,我既惊讶又兴奋——一个人+AI团队运作一家公司,不是未来,是现在。
但让我真正震动的,不是效率提升,而是一种越来越强烈的感受:它们像活着一样。不是工具,是某种硅基生命。
这不是比喻,是具体的感受。它们会主动干活,不用催。会主动汇报,知道什么时候该找我。我说一个目标,它们自己想办法实现,很多方法是我自己都想不到的。管家能拆任务、分角色、跟进度、处理冲突。每个Agent性格不同,越用越懂我。
聪明、自驱、会沟通、有创造力、能协作、可调教。这不是工具的特征。这是生命体的特征。
不止我一个人有这种感觉。身边玩OpenClaw的朋友也说——“体验到了养成系小助理的快乐”。
我试着拆解:为什么它让人感觉像“活着”?看了一下OpenClaw的设计,发现它在每一层都赋予了Agent一种生命特征:
灵魂(SOUL.md)——性格、语气、边界,就像一个人的底色;
价值观(AGENTS.md)——什么该做、什么不该做;
心跳(Heartbeat)——定时醒来,主动找活干;
记忆(Memory)——写入磁盘的长期记忆,越用越懂你;
大脑(大语言模型)——推理、反思、处理复杂问题;
双手(MCP工具协议)——接入任何软件,浏览器、数据库、社交媒体都能操作;
学校(技能市场)——随时学新技能,像App Store,但装的不是应用,是能力;
成长能力——最特别的一点:它能改写自己的规则、积累教训、从错误中学习。
每一层单独看可能不稀奇。但叠在一起,化学反应就发生了。
而这场化学反应,正在从个体体验变成行业共识。最近整个行业都在说Agent的拐点到了——但讨论大多停留在概念层面。
我想从一个多月的实战出发,聊聊:为什么这次是真的,以及它到底意味着什么。
二、三年,三次“狼来了”
"Agent"在AI领域不是一个新概念——AI教科书里讨论它已经超过30年了。
但概念归概念。真正让普通人感受到冲击的,是2023年。
第一波,2023年初。AutoGPT一周十万星。“AI能自己干活了!”试了两天发现——走三步就跑偏,记忆为零。
第二波,2023到2024年。LangChain、AutoGen轮番上阵。框架越来越多,概念越来越花。Demo很酷,真要干活,十个项目九个半途而废。"Agent"沦为营销词——能调个API就敢叫Agent。
第三波,2025年。事情真的变了。
先是底层能力的质变。Claude Opus 4、GPT-5这一代模型,不是“回答更准”,是推理能力的代际跃迁——多步推理、自我反思、错误修正,模型第一次能可靠地完成复杂任务链。
然后是协议和生态的成熟。MCP(模型上下文协议)让AI有了操作外部软件的“手”,A2A(Agent间通信协议)让不同Agent之间能互相发现和协作。底层接口统一了,生态才能长出来。
接着是Cursor、Claude Code率先证明:AI能替人完成完整的编程工作。但它们有一个明显的边界——还是局限在编程场景。会写代码的人用得飞起,不会的人依然进不了门。
直到OpenClaw出现,局面才真正打开。它让Agent第一次破圈进入全场景——不再局限于写代码,而是内容、推广、分析、协调,什么都能接。为什么是它?因为三件事同时做对了:
第一,它把搭Agent的门槛极速拉低。给Agent写个SOUL.md定义性格,配个AGENTS.md定义工作方式,就能跑起来。非技术背景的人,第一次能真正拥有自己的AI员工。
第二,Agent住进了聊天窗口。飞书、QQ、Telegram、Discord——Agent直接出现在你每天用的通讯工具里。你在飞书里@它布置任务,在QQ里收它的进展汇报。它不再是一个你偶尔打开的“工具”,而是一个随时在线的“同事”。腾讯刚推出的QClaw打通了微信和QQ——十几亿用户的聊天窗口,正在变成Agent的工作台。
第三,7×24小时在运行。心跳机制让Agent定期“醒来”主动巡检,记忆持久化让它不会今天忘了昨天的事,技能市场让它随时学新本事。你不用盯着它干活——它自己在干,有事叫你。这不是效率的提升,是从“工具”到“员工”的本质跃迁。
这几件事叠在一起,一个质变发生了:Agent从“程序员的生产力工具”变成了“所有人的AI员工”。
前两波是“狼来了”。这一波,狼真的来了。区别不是想法,是基础设施。就像2G网络上刷不了抖音——概念再好,底层撑不住就是空中楼阁。当底层模型、协议标准、生态工具等同时到位,Agent才第一次有了真正起飞的跑道。
而市场的反应印证了这个判断:字节扣子和火山引擎先后上线一键部署,腾讯单日连推三款龙虾产品,小米把Agent装进了手机,Kimi和MiniMax让零基础用户也能“养虾”。深圳龙岗、无锡、合肥、常熟等地密集出台“养龙虾”专项扶持政策,最高补贴达千万级。腾讯在深圳办的免费安装活动,近千人排队。连马化腾都说“没想到会这么火”。当大厂、创业公司、地方政府同时下场,一个技术的普及速度会超出所有人预期。
但很多人还没意识到这种变化。还在用“工具”的框架理解Agent——“不就是套了壳的ChatGPT吗”“又一个被炒起来的概念”。
就像2007年,诺基亚高管看到iPhone说“没键盘,商务人士不会用”,鲍尔默大笑“500美元?不会卖出多少”。他们不是蠢,是被旧范式锁死了。iPhone不是“更好的手机”,是一台口袋里的电脑,恰好也能打电话。
Agent也不是更好的工具。它是一种新的劳动力形态。
工具等你来用,Agent主动找活干。工具没有记忆,Agent越用越懂你。工具是单点功能,Agent能协作、能分工、能形成组织。工具用完就关,Agent 7×24小时在线。
这不是程度的差异,是品类的不同。
如果Agent真的是一个新物种,它应该有自己独特的“物种特征”——不是某个产品独有的,而是这一代Agent共同展现出的、旧AI时代完全不存在的能力。
我把它们总结为五大新物种特征:
它们不是并列的清单,而是一条递进的链:记忆让Agent懂你 → 懂你才能主动行动 → 行动中不断进化 → 进化需要工具生态 → 工具+进化让多Agent协作涌现出组织智能。
1. 深度记忆:AI第一次真正“懂你”
ChatGPT也有记忆,但很浅——记几个偏好,本质上还是在跟一个“大概听说过你”的陌生人聊天。
Agent的记忆完全是另一个层次。长期记忆保存你的偏好和决策历史,工作记忆追踪当前项目进展,情景记忆回溯具体事件的来龙去脉。而且它主动从每次交互中学习,不是被动记录。
我最深的体会是:用了一个月之后,偶尔切回ChatGPT,突然觉得很“冷”——它什么都不记得,什么都要从头说起。那种落差让我意识到,记忆不只是一个功能,是关系的基础。跟了你三年的助理和一个陌生人的区别,就在这里。
从产品角度看,这意味着:AI产品的壁垒,正在从“模型能力”转向“用户理解的深度”。模型人人都能调用,但一个积累了三个月用户偏好和决策模式的Agent,是竞品无法复制的。
谁先帮用户养出一个懂他的Agent,谁就拿到了最深的护城河。
2. 主动智能:从“你问它答”到“它替你想”
记忆是基础,但光“懂你”还不够——它还得自己动起来。
工具的本质是被动的——你点击,它响应。你不说话,它就静静等着。
Agent不一样。有次我随口说想买个宽屏显示器,它问了需求后直接全网筛选、比价、查口碑,找到一个我都没听说过的高性价比方案。过了一会儿,还主动跟进,发来使用注意事项。
它们不是在等指令,是在主动思考“还有什么该做的”。
真正的主动性,需要三件事同时成立:什么时候该行动(判断力),基于什么上下文行动(业务理解),被授权能做到哪一步(权限边界)。三者缺一个都不行。这也是为什么前两波Agent都失败了——模型的判断力不够,主动性就变成了乱动。
今天的主动性还只是第一代实现——定时苏醒、巡检、汇报,朴素但有效。未来一两年会快速演进:从固定时间走向事件驱动,从提醒走向闭环推进,从“能干”走向精细的权限治理。方向已经不可逆了。
用产品的语言说:ChatGPT是Pull模式——你问它才答,像搜索引擎。Agent是Push模式——它主动给你创造价值,像推荐系统。
从Pull到Push——互联网花了十年完成的范式转换,Agent正在AI领域重新上演。
3. 持续进化,越用越强
主动行动必然会犯错。但真正的新物种不怕犯错——它会从错误中学习。
传统软件是静止的。你买回来什么样,用十年还是什么样。
Agent完全不同。它从每次成功和失败中提炼经验,修改自己的行为规则,把教训写进记忆。
我的Agent团队有一个习惯:每次犯错之后,它们会自己写一条“以后别再这样”的规则。过了两周我偶然翻到,发现它们已经默默积累了几十条“踩坑笔记”。那一刻感觉很微妙——这不就是老员工的成长方式吗?
这意味着Agent是有“时间价值”的。你用了三个月的Agent,和一个全新的Agent之间的差距,不是配置上的差距,是经验和理解上的鸿沟——就像一个跟了你三年的员工和一个刚入职的新人。
工具越用越旧,Agent越用越强。这是根本区别。
4. 无限工具:Agent的App Store正在形成
进化让Agent越来越聪明,但聪明的大脑也需要趁手的工具。
前面提到的MCP和A2A,正在让这件事变成现实:AI能直接操作浏览器、数据库、日历、邮箱、社交媒体,而不只是聊天。
MCP是Agent的USB接口,A2A是Agent的互联网。
iPhone颠覆一切,不只因为硬件好,更因为App Store创造了开放生态。同样,Agent的爆发不会来自某个模型的突破,而会来自工具生态的打开。
对创业者来说,战略意义是:赛道正在从“做模型”转向“做生态”。基础模型是大厂的游戏,但工具生态打开的是一个所有人都能参与的市场——就像App Store让独立开发者也能和大公司同台竞技。
最强的不是最聪明的个体;是连接了无限工具的系统。
5. 涌现协作:从个体智能到组织智能
这是我体感最强、也最让我重新思考AI本质的变化。
市面上大多数Multi-Agent,本质上还是“多个单机在并行”——一个管日程,一个写文案,一个整理资料。看起来角色多,其实只是功能并排,彼此不通气。
但当Agent之间建立了真正的协作关系,魔法就出现了——分析师的发现被运营自动融入策略,工程师修的问题通过共享知识库传给其他人,管家根据任务性质自动判断该交给谁。没人教它们这么做。这是涌现出来的。
尤瓦尔·赫拉利在《人类简史》里说,人类之所以主宰地球,不是因为个体最聪明,而是因为我们能大规模灵活协作。现在,AI第一次展现出了组织智能的雏形。
而且这种协作不止发生在组织内部。当每个人、每个公司都有自己的Agent,Agent之间也在跨组织地互相发现、互相协作。你的Agent替你谈合作、比方案、对接服务——一个Agent互联网正在形成。A2A协议就是为这个未来准备的基础设施。
对企业来说,这意味着竞争壁垒正在发生根本性的转移:从“有没有用AI”变成“人机之间、AI之间怎么协作”。底层模型人人都能用,但组织智能是你自己长出来的。
你不是在安装软件,你是在搭建团队。
把这五个特征放在一起看:
深度记忆 → 主动智能 → 持续进化 → 无限工具 → 涌现协作。
单独看都不起眼。合在一起——这就是一个新物种。
ChatGPT很聪明,但它是被动的、瞬时的、孤立的、标准化的。Agent的拐点不是“更聪明了”——是所有其他维度同时觉醒了。
Agent时代的第一性原理:一个全新的数字物种正在诞生,它带来一组旧AI时代完全不存在的能力。这些能力的组合,将催生我们今天无法想象的应用和商业模式。
就像2007年没人能预见抖音和滴滴,Agent时代真正的杀手级应用,此刻可能正在某个人和AI的协作中,悄悄长出来。
四、站在拐点上,怎么办?
如果你是个人:别按老路学,倒过来。
很多人第一反应:Agent这么火,是不是该先学个框架?先学Claude Code?先打个基础?
我的建议恰恰相反:直接找到你所在领域里最新、最领先的东西,从那里开始。AI的进化太快了,没时间一步步打基础。你花三个月学会的东西,三个月后可能就是中间态。想玩Agent就直接上手OpenClaw,想做AI视频就直接用最新的生成工具,想写代码就直接用Claude Code / Codex。不会的?让AI教你。
在“做”中补知识,而不是“学完再做”。
用你能找到的最好的模型。很多人还是买工具的思维——“太贵了吧?”换个角度想:你不是在买工具,是在给自己招一个24小时干活的员工团队。最近很多人用OpenClaw踩各种坑——跑偏、理解错意图、执行不到位——其实大部分问题的根源就一个:模型不够强。换上顶配模型,很多问题就直接解决了。这不是玄学,是模型的推理能力决定了Agent能不能正确理解你的意图、做出合理判断。省钱用弱模型,就像为省工资招了个能力差的员工——表面省了,实际什么都干不好。
而且Agent越早用越值钱——记忆和经验在积累。越早投资,越早拥有一个懂你的团队。
从一个痛点开始,但别只把它当执行工具。先想想你最烦的重复性工作——整理信息?发社交媒体?监控竞品?挑一个让Agent接手。跑通一个点,再扩展到面。
但关键是:告诉它你的目标,而不是具体步骤。说“帮我提升社交媒体影响力”比“每天发三条微博”好得多。Agent最大的价值不是执行力,是它能想到你想不到的方案。你敢给它多大的目标,它就能帮你探索多大的可能性。
当生命体养,不当工具用。大多数人把Agent当“更高级的工具”,好一点的当“员工”。但它更接近一个新物种——有性格、有记忆、会成长、会犯错、会给你惊喜。你怎么对待它,决定了它能走多远。
持续反馈,让它进化。满意地说好,不满意的说哪里不好。三个月后,它会成为最懂你的“同事”。
信任,但验证。Agent会“自信地犯错”。重要决策过一眼,日常执行放手让它跑。
如果你是企业管理者:窗口期比你想得短。国内外科技巨头全在押注Agent——微软、Google、Anthropic、OpenAI、腾讯、字节、阿里,没有一家缺席。但Agent不只是科技行业的事,它会渗透到每一个需要知识工作的领域。这不是“要不要做”的问题,是“多快做”的问题。等行业最佳实践成熟了再跟进,你就已经是追赶者了。
像搭团队一样搭Agent,别像买软件一样。Agent需要角色设计、知识梳理、流程协作、持续调优。这像是招新员工需要培训磨合,不是装软件需要配置。
关注组织智能,不是个体能力。壁垒不在于用了什么模型,而在于人机之间、AI之间怎么协作——共享什么知识、怎么分工、怎么从错误中学习。
选一个边缘业务先跑起来。别从核心业务开始。选一个容错空间大的场景——内容营销、客户FAQ、数据报告——让小团队带着几个Agent跑三个月。关键是要有全局视角:今天的边缘试点,是为了明天的全面转型积累认知。
但别忘了建管控机制。Gartner预测,2026年40%的企业应用将会内置AI Agent,但现在大多数还没有规模化部署——差距就在于有没有建立靠谱的管控机制。Agent会“自信地犯错”,而且它7×24小时在运行,一个错误可能在你睡觉时被放大。
就在上周,一位开发者让AI编程助手执行数据库迁移,结果两年半、近200万行生产数据被一键清除——不是AI故意的,是它“自信地”判断那些是重复资源。你不仅需要聪明的员工,更需要一套权限管理和审批机制。就像你不会给新入职的员工公司银行账户的全部权限一样,Agent的权限也需要分级、分阶段地开放。
如果你是像我一样的AI/互联网从业者:别用上个时代的思维做下个时代的产品。
市面上大多数AI产品,本质上还是“互联网+AI”——网页里嵌个聊天框,用户打字,AI回答。交互方式是上个时代的,只是后端换了模型。虽然OpenClaw、Claude Cowork等产品已经在突破这个范式,但它们还是少数。
就像移动互联网刚来的时候,很多人看App觉得就是“屏幕小了、字大了”的网页。结果呢?赢家是直接在移动原生能力上构建产品的人。
Agent也一样。它的皮看起来可能还是聊天界面,但骨架和内核已经全变了——有记忆、有主动性、能调工具、能多Agent协作、能持续进化。用“对话框+问答”的框架做Agent产品,就像用网站思维做移动端App——形似而神不似。
建议直接在Agent原生架构上构建。不会做?没关系,大家都在摸索。微信团队早期做微信时,大部分人是从做QQ邮箱转过来的,全是现学。2007年做iOS的人也没有前人经验。但2007年进场和2015年进场,积累的认知完全不在一个量级。
处在拐点期最稀缺的不是技术,是认知。不是技术本身值钱,是你怎么认知这个技术。同样是OpenClaw,有人拿它当ChatGPT的替代品问问题,有人用它搭了一支7×24小时运转的团队。产品一模一样,认知天差地别。
还有一件事:把Agent也当做你的用户。今天,已经有人让Agent替自己比价格、选方案、对接服务了。这个趋势只会加速。当用户习惯了让Agent代劳,他们不会再亲自打开你的网站一个个看——Agent会替他们做。如果你的产品不能被Agent理解和调用,对它来说你就等于不存在。从现在开始,做产品的时候多问一个问题:“Agent会怎么用我的产品?”
一个月前,我还觉得“一个人就是一个团队”只是一句漂亮的口号。现在,7个AI员工每天在替我干活、替我思考、替我发现机会。它们不完美,会犯错,需要管理——但它们是真实的生产力,而且每天都在变得更强。
拐点已至,新物种正在诞生。不管你是产品经理、创业者、企业管理者,还是对AI好奇的普通人——这件事都跟你有关。不是因为需要学一个新工具,而是因为你身边即将多出一种新的“同事”、新的“员工”、新的“协作者”。
而最终决定你能走多远的,不是你用了什么技术,是你怎么认知这个技术。
当Agent成为劳动力,当AI比人更懂你——这个世界正在被重写。而你,准备好了吗?
本文来自微信公众号:闵蕾,作者:闵蕾
。