盘点2025:决定AI走向的八个里程碑事件

2025年,人工智能真正从云端走下,成为如同水电般触手可及的基础设施与生产力。工厂生产线上的机器人流畅地拧紧螺丝,手机在你开口前便理解你的需求,写代码、做研究时仿佛有一个“超级大脑”在背后默默协作……这些不再是科幻场景,而是正在发生的日常。AI迅猛发展的背后不是某项技术的单点突破,而是一系列彼此咬合、环环相扣......

盘点2025:决定AI走向的八个里程碑事件

本文来自微信公众号: 第一新声 ,作者:竹心

2025年,人工智能真正从云端走下,成为如同水电般触手可及的基础设施与生产力。

工厂生产线上的机器人流畅地拧紧螺丝,手机在你开口前便理解你的需求,写代码、做研究时仿佛有一个“超级大脑”在背后默默协作……这些不再是科幻场景,而是正在发生的日常。AI迅猛发展的背后不是某项技术的单点突破,而是一系列彼此咬合、环环相扣的系统性跃迁——就像一组精密啮合的齿轮,一旦转动,便带动整个社会机器加速运转。

围绕AI技术大范围落地的2025年,第一新声系统梳理出推动行业演进的八个关键节点。它们不仅代表着技术本身的突破,更映射出一场从生产到生活、从个体到社会的系统性的颠覆变革。

技术路径逐渐清晰,产业逻辑悄然重构。世界正在被一行行“智能代码”重新编译——而我们每一个人,既是这场变革的见证者,也正在成为它的参与者与塑造者。

深度求索DeepSeek-R1:低成本、高性能与开放生态

2025年1月,中国深度求索公司正式发布DeepSeek-R1模型。彼时,全球人工智能领域正处于关键转折期:GPT-4等顶尖模型虽能力出众,但训练和使用成本极高,让多数机构和企业难以触及;与此同时,行业迫切需要高效、易普及的AI方案,推动技术走出实验室、落地各行各业。

DeepSeek-R1的出现,则恰好解决了“高性能”与“高成本”的核心矛盾。

其最亮眼的地方,在于它“以小博大”的突破。作为仅含120亿参数的开源模型,它在多项测试中的推理、代码生成能力,却堪比万亿参数级的GPT-4。

这背后,是深度求索团队在算法上的创新——通过优化模型架构、调整训练策略等方式,大幅提升了模型效率。据官方数据,其训练成本比同类性能模型降低90%以上,日常使用成本也大幅下降,真正实现了“用更少资源,获得顶尖智能”。

这一突破迅速引发市场热烈反响。模型发布后,全球开发者纷纷尝试应用,初创公司、高校实验室甚至个人研究者,都能轻松部署和优化这款高性能模型。企业也无需巨额算力投入,就能拥有顶尖AI能力,AI应用的门槛被显著降低。

“参数越大越厉害”并非唯一真理,算法创新同样能释放巨大潜能。深度求索公司也凭借这个优势从行业新锐一跃成长为了推动AI普及的关键力量。

当性能不再与成本绑定,AI落地的速度和范围,将迎来全新提升。

论DeepSeek-R1在2025年的战绩,它让更多参与者能平等参与创新;同时也开辟了“低成本高效大模型”的新赛道,让行业重新思考AI发展方向。

作为国内首个在推理领域达到国际领先水平并全面开源的大模型,在推动AI从“稀缺资源”成为“基础设施”的道路上,DeepSeek-R1在2025年留下了浓墨重彩的一笔。

Monica Manus:从“智能助手”向“智能执行体”的关键演进

2025年初,以DeepSeek-R1为代表的大模型已在内容理解与生成上取得突破,但人工智能的能力大多仍停留在“对话”与“分析”层面。如何让AI不仅能“思考”,更能自主“行动”——感知环境、规划步骤、调用工具并完成任务,成为行业亟待攻克的下一个关口。

Manus是由中国AI创业公司Monica于2025年3月推出的一款通用AI智能体。其核心突破在于智能体构建了“感知-决策-执行-优化”的完整能力闭环,实现了从“对话”到“行动”的质变。

多项亮眼的数据足以支撑其关键技术突破。在评估AI执行现实世界复杂任务的权威基准测试GAIA中,Manus取得了86.5%的优异成绩。该测试包含466道需要多步骤推理与多工具协作的题目,即便是配备插件的GPT-4在测试中的准确率也仅为15%。这一成绩充分印证了Manus在通用智能领域的过硬实力。

卓越的技术实力也带来了亮眼的市场表现。Manus上线仅9个月,年化营收就突破了1.25亿美元,快速实现了技术价值向商业价值的转化。资本也迅速瞄准其强大的商业化潜力,科技巨头Meta随后以数十亿美元对Manus发起了收购。

这一收购事件不仅是对Manus技术实力和商业潜力的高度认可,更标志着AI Agent(AI智能体)领域的商业化正式走向成熟,结束了此前AI智能体“叫好不叫座”、难以规模化盈利的困境。

从提供建议的“大脑”升级为能交付成果的“智能体”,Manus作为全球首个实现全链路闭环的通用AI智能体,其成功的商业路径为全球AI企业提供了从技术创新到市场变现的关键借鉴。

阿里Qwen 3系列:AI的技术开源

2025年5月,阿里将自家最新一代大模型Qwen 3系列,从最小的7B到最强的72B参数版本,连同训练框架全部开源。

在当时全球58个权威AI测试里,Qwen 3系列可是有39项拿了第一。他的核心技术突破来自于“混合专家注意力机制”的创新。以前的模型处理一个问题需要调动所有的参数,效率低、耗电高。而Qwen 3则像成立了一个“专家智囊团”,处理某个问题只需要激活部分“专家”,效果直接提升了40%,对于算力的要求也大大降低。

当整个行业巨头都在紧握闭源模型、构筑付费高墙时,阿里Qwen 3系列的开源,无异于一次逆流而上的“掀桌子”行为。

把最顶级的技术开源,阿里当然不是在做慈善。这背后,是一场极高明的生态“阳谋”。阿里并不想单单做一款产品,而是想建立属于自己的“生态帝国”。

效果当然立竿见影。一时间,创业公司呈现“井喷”现象:数据显示,国内AI创业公司数量此后猛增了400%。开源就像一个强大的磁铁,把高校、研究所、企业和无数开发者吸附到一起。开发者共同改进模型、共享数据、开发工具,形成了一个有中国特色的技术共同体。

“中国AI开源联盟”雏形初现:这彻底改变了中国AI力量过去“单打独斗”的局面,开始“抱团”与全球巨头对话。

而Qwen 3系列真正厉害的地方,不是抢“榜单第一名”,而是抢“规则定义权”。

当全球AI都跟着OpenAI的闭源节奏走时,阿里用开源开辟了“第二赛道”。它告诉世界,AI的未来不只有“付费订阅”这一条路,完全可以有更开放、更普惠的玩法。这迫使所有玩家都必须重新思考自己的商业模式。

它用“算法创新”挑战“算力霸权”。在大家都在疯狂堆芯片、拼数据中心的时代,阿里用精妙的算法设计证明,用更少的电、更便宜的钱,做出顶尖的智能。

在某种意义上,Qwen 3系列的发布,不是一次产品的终点,更像是一场关于中国AI如何创新、如何生存、如何赢得尊敬的宏大叙事的起点。

Open AI GPT-5:AI即服务生态成型

2025年8月8号凌晨,当大多数人还在睡梦中时,科技圈被一则消息炸醒了:OpenAI的GPT-5,正式上线。

自从2023年3月GPT-4惊艳全场后,AI好像卡在了一个瓶颈期——它很聪明,但会时常出现“幻觉”问题;它能处理文字和图片,但无法真正理解声音和视频;它是个好工具,但离一个能独立干活的“同事”还相差甚远。

整个行业都在问:下一步,AI到底该往哪走?GPT-5给出了参考答案。

2025年8月8号凌晨,OpenAI正式发布GPT-5系列模型,其性能表现实现多维度突破。在SWE-bench Verified测试中拿下74.9%的成绩,高于o3的69.1%和4o的30.8%;在医学影像推理和理解方面的准确率则分别比人类专家高出24.23%和29.40%。

其多模态感知能力得到也全面整合。GPT-5标志着首个真正意义上的通用人工智能模型的出现。它超越了以往仅限于文本和图像处理的局限,实现了对文本、图像、音频、视频乃至3D模型的多模态统一理解与生成。

GPT-5最突破的一点在于模型具备自主任务执行能力。

用户无需再将复杂任务逐层拆解并分步指导,只需设定高级目标,GPT-5可自主完成从任务规划、步骤分解、过程执行到结果校验的全流程。

这意味着AI从需要精细操作的辅助工具,转变为了能够独立管理项目并对输出结果负责的自主智能体。

这一系列突破已经证明,大模型正在从能完成任务向能高质量完成复杂任务跨越,而这场跨越,终将深刻改变我们与技术互动的方式。

4.8%的幻觉率,让它的输出从一个“需要警惕的参考”,开始变成“可以采纳的建议”,工作模式在“人机协作”技术推动下被重塑……GPT-5的核心功能免费向所有用户开放的商业策略,也彻底改变游戏规则。一夜之间,全球数亿用户都能零门槛地接触到这个最顶尖的AI。学生用它来辅助研究,创作者用它来激发灵感,程序员把它当成全天候的编程搭档。微软更是迅速行动,把GPT-5的能力深度塞进了Office全家桶和GitHub,打工人和开发者的效率被集体刷新。

技术竞赛进入了新赛道。GPT-5之后,单纯比拼模型参数大小的时代彻底过去了。行业的竞争焦点,在如何让AI更可靠、更自主、更能无缝融入真实世界的复杂任务前面,画下了一条新的起跑线。

优必选Walker S2:人形机器人走进工厂

2025年10月,制造业领域迎来一个标志性节点:昔日高昂而稀缺的人形机器人,真正开始批量走进工厂车间。

深圳优必选公司将其全新一代人形机器人Walker S2推向量产,首批1000台订单被特斯拉、宁德时代等高端制造巨头采购。最引发震动的是其价格——单台定价25万元人民币,相较于上一代产品,成本降幅超过一半。

与优必选Walker S2量产相呼应的,是宇树科技在2025年春节期间的意外爆火。其展示的人形机器人凭借灵活自如的动作和生动的互动表现,在社交平台广泛传播,迅速闯入大众视野。

如果说宇树科技的破圈则代表了这项技术在大众消费认知层面完成了“广泛启蒙”,那么优必选Walker S2的量产标志着具身智能在工业场景实现了规模化“深度落地”。这场爆火不仅为产业带来了空前的关注度与市场热度,更直观展现了人形机器人在娱乐、陪伴、服务等多元场景下的潜力。

这些“钢铁侠”并不再是橱窗里展示品,而是工厂里能实际执行流水线拧螺丝、部件搬运、质量检测等任务的“新型劳动力”。

它的量产也如同一声号令,宣告了一个争论已久的命题走向现实:人形机器人已不再仅是前沿探索,更是一门算得清经济账、具备商业价值的生意。

这是人工智能第一次系统性获得在真实世界中自主行动、产生影响的能力。起点虽是工厂,但远景绝不仅限于此。当“大脑”与“身体”的融合日益成熟、成本持续下探,其走向家庭、商场、医疗等复杂场景的普及之路将清晰可见。

谷歌Gemini 3.0:开启“深度推理”纪元

2025年11月,Google正式发布了其千呼万唤始出来的Gemini 3,这不仅是一次产品迭代,更是AI发展路径上的一座分水岭。

它的诞生背景,是整个行业对AI能力的一次集体追问:大模型除了能“说出”海量知识,能否真正像人类一样“理解”并“思考”复杂问题?Gemini 3给出的答案是肯定的,它标志着AI从“博闻强识的学者”,正式迈向了“能深度推理的专家”时代。

其核心突破,在于重新定义了衡量AI能力的关键指标。过去,AI行业热衷于比较模型的参数规模、基准测试分数。而Gemini 3之后,行业开始更严肃地关注“思维链”(Chain-of-Thought)的深度与可靠性、复杂问题拆解的逻辑严谨性,以及跨模态(文本、图像、代码)统一推理的连贯性。

Gemini 3.0“深度思考”模式的引入,让AI首次展现出接近人类的系统性推理能力。

面对国际数学奥林匹克竞赛级别的复杂问题,Gemini 3.0不再依赖概率生成答案,而是能在内部进行逐步推演、验证,并输出完整且可追溯的逻辑证明。这使得AI的输出从“一个可能正确的回答”转变为“一个有理有据的解题过程”。

这一能力的突破将AI从擅长归纳与生成的语言“通才”,重塑为能在科学、编程、金融等需要严密逻辑的领域担当协作伙伴的“逻辑学家”,这为“AI for Science”奠定了变革性范式。

与之并行的,是其感知能力的跨越式升级。Gemini 3.0实现了对实时物理世界的深度理解与交互。其多模态能力不仅限于解析静态图文,更能通过摄像头视频流实时分析动态场景:无论是指导维修复杂设备,还是解读体育比赛中的战术意图,它都能像具备经验的助手一样进行交互。

AI从处理离线信息,迈向了与流动现实世界同步感知与响应的新阶段,也为具身智能和无处不在的交互式服务打开了大门。

技术上的成功,直接反映在了谷歌的商业成绩单上。在OpenAI和微软的强势压迫下,沉寂了一段时间的谷歌,凭借Gemini 3.0打了一场漂亮的翻身仗。

最直接的影响是“谷歌云”业务。企业客户,尤其是那些需要处理复杂数据、进行科学计算或渴望智能化升级的公司,纷纷转向提供强大推理能力的Gemini。据数据显示,这直接带动谷歌云AI服务收入飙升了300%。谷歌凭借坚实的模型能力,重新坐回了全球AI竞赛牌桌的核心位置,与OpenAI、微软等巨头形成了有力的竞争格局。

豆包手机:AI终端重构

12月1日,字节跳动旗下AI助手豆包与中兴通讯合作推出的nubiaM153工程机启动小批量发售,官方售价3499元,首销备货量约3万台。不过,由于这是目前唯一一款将豆包嵌入底层操作系统的手机,可实现与系统的深度交互,引发了众多手机发烧友的追捧,其在二手平台的标价甚至达到7999元,溢价率达128.61%。

无独有偶。以iOS 19、Android 15和Windows 12为代表的主流操作系统,也纷纷将AI能力从独立的应用层下沉,构建出底层的“系统级AI代理层”。

这意味着AI不再是需要被“打开”的特定工具,而是化为设备内部无处不在的基础设施,真正实现了从“应用”到“系统能力”的根本转变。

手机能够自动整理相册、生成图文并茂的旅行攻略,并在视频通话中实现高准确率的实时翻译;PC则能辅助编程、自动摘要文档并智能记录会议,将用户从繁琐的操作中解放出来。所有的趋势都表明,2025年,智能手机与个人电脑已经迈入了一个以系统级AI深度集成为标志的新纪元。

以“豆包手机”为代表的实践,通过软硬件深度协同优化,成功将强大的端侧AI体验带入主流价位段。这不仅印证了AI普惠化的趋势,更以“鲶鱼”之姿,为行业探索高端体验下沉与差异化竞争提供了可行路径。

新范式早已形成可观规模。根据IDC等权威机构数据,2025年全球具备生成式AI能力的手机出货量已达约3.7至4亿部,已占总出货量的近30%。

2025年的颠覆变革,其深远意义在于通过系统级AI集成,从根本上重塑了人机交互范式。以苹果、谷歌、微软,以及像豆包手机这样的实践者为代表的终端创新,成为了这一历史性转折中的关键注脚。

人形机器人:“超级员工”的争夺之战

2025年的人形机器人舞台精彩纷呈。

从特斯拉到中国的小鹏、华为以及原力无限,一场由全球科技巨头引领的人形机器人竞赛,突然从实验室的慢跑进入了产业化的冲刺阶段。这些曾经在电动车、智能手机领域厮杀的企业,不约而同地在2025年的不同月份,亮出了自家机器人的最新进展。

特斯拉以量产为先锋,瞄准工厂。12月,特斯拉展示了第二代Optimus的惊人进展:自主流畅行走、精准识别并抓取物体。它的目标最明确:在2026年实现量产,并将单价压到2万美元(约合15万人民币)以内。

马斯克的野心,是让它先成为汽车工厂里的“超级员工”。

小鹏则是以场景驱动,聚焦家庭。11月,小鹏汽车生态企业发布的人形机器人,凭借极度拟人、灵活的步态在网络上爆火。这不仅是技术秀,它随即获得了15亿元的融资,清晰地将未来赛场定位于家庭服务场景,希望成为未来的家庭管家或陪伴助手。

华为赛力斯是走技术融合,赋能产业。早在7月,华为与赛力斯联合展示的机器人demo,就揭示了另一种思路:强调“AI大脑”与新能源车领域积累的“机电躯体”技术深度融合。它不急于推出成品,而是探索如何将机器人作为其智能汽车技术生态的延伸与应用。

原力无限则专注“机器人+文旅”,依托自研Hyper-VLA多模态大模型及“一脑多身”全栈能力,实现机器人感知、决策与执行的深度融合。一笔2.6亿元的战略合作协议,成为了全球具身智能领域迄今单笔金额最大的商业订单。订单的落地,不仅打破了具身智能技术在文旅场景“单点试点”的发展困境,更在AI领域树立起技术规模化商业落地的重要标杆,形成了可复制、可推广的“技术研发-场景适配-商业变现”全链路落地范式。

这场竞赛能热起来,核心在于技术突破了临界点:身体更灵巧了,核心的伺服电机性能大幅提升,让机器人的关节运动精度达到了惊人的0.01毫米级,动作不再僵硬。眼睛更明亮了,基于大模型的视觉识别技术,让机器人能真正理解复杂环境,分清“这是一把需要抓起的扳手”和“这是一个需要绕开的行人”。续航也更持久了:新型电池和能耗管理技术的进步,让部分实验室样机的持续工作时间提升至8小时,初步满足一轮工作班次的需求。

当然,资本也用真金白银的投票掀起了市场狂热。

2025年,整个人形机器人领域成了一个巨大的风口。据统计,全年人形机器人的融资总额超过了500亿元人民币,新冒出的创业公司数量增长了300%。投资人相信,这不仅仅是又一个科技概念,而是继个人电脑、智能手机之后,下一个可能重塑所有行业的平台型终端。

不管各家打法如何,虽然路径不同,但目标一致:人形机器人早已成为科技巨头们战略布局的下一站,是AI技术寻找“用武之地”的必然出口。而这场竞赛的赢家,或许将定义下一个十年的科技面貌。

2025年,人工智能褪去了科幻的光环与实验室的襁褓,以一种更务实、更细腻、更温暖的方式,嵌入了人类社会的骨架与肌理。2026年,人工智能将在纵深融合上大步迈进,一个由深度融合的智能所驱动、更自主、更普惠的数字社会图景,正缓缓展开。

THE END
免责声明:本文版权归原作者所有;旨在传递信息,不代表鲸媒智集的观点和立场。
相关阅读
  • 350位CEO:有关AI的三重真相和投资逻辑

    350位CEO:有关AI的三重真相和投资逻辑

    分钟咨询公司Teneo调查了350位年营收超过十亿美元的上市公司CEO,针对有关于AI的支出(CapEx)等关键问题做了调研,得出了一份非常具备参考性,同时也在某些方面与大众认知出现反差的信息报告。核心信息及数据如下:68%的CEO计划在2026年…

    2025年12月19日 14:43
  • MIT仅录取2人,斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

    MIT仅录取2人,斯坦福、密歇根狂撒20枚录取...今年的美国早申, 中国学生卷到新高度

    早申放榜只是美本申请的开端,数据显示,ED录取率通常只有20%左右,有超过70%的申请者最终都是在RD阶段竞争。所以即使在早申里没有获得理想的结果,也不意味着申请就结束了。

    2025年12月19日 14:37
  • AI时代最重要的技能

    AI时代最重要的技能

    如果说这辈子最需要掌握的技能是啥,我觉得有俩:1、搜索能力;2、输出能力。这里说的“搜索”当然跟之前搜索引擎时代不太一样了,不过逻辑是相同的,都是从浩如烟海的网络信息里查找自己需要的。大家应该注意到了,自从大模型出现后,信…

    2025年12月17日 16:37

栏目精选