更新时间:2026-02-14 13:37 来源:牛马见闻
谷歌就推出了Gemini 3 Deep Think的重大升级Gemini 3 Deep Think获得了3455分的Elo评分时间宣布了Gemini 3 Deep Think的发布
<p class="f_center"><br><br></p> <p id="4AN1GLNK">谷歌CEO皮查伊在X上高调宣布,Gemini 3 Deep Think在最]难的挑战!上,取得了前所未有的成绩。</p> <p id="4AN1GLNM">这个项目,正是姚顺宇加入谷歌后参与的第一个重量级项目。</p> <p id="4AN1GLNO">作为谷歌的对手之一,xAI的创始人马斯克都不由得在这条贴文里留下了一句“令人印象深刻”,皮查伊则回复给他一个“大拇指”表情。</p> <p class="f_center"><br><br></p> <p id="4AN1GLNQ">然而,当人们翻看姚顺宇的履历时,通常都会以为自己搜错名字了。</p> <p id="4AN1GLNS">但你没有看错,姚顺宇的确没有任何计算机背景,他本身是一位理论物理学家,他的博士研究方向是量子引力和量子信息扰乱。</p> <p id="4AN1GLNU">正所谓遇事不决量子力学。</p> <p id="4AN1GLO0">当Scaling Law逐渐失效,AI产业正在经历的一场变革。</p> <p id="4AN1GLO2">真正能给AI带来突破,带着人们走向AGI的,或许反而是那群懂得用物理,来理解“智能”这个词本质的人。</p> <p id="4AN1GLO4"><strong>01</strong></p> <p id="4AN1GLO5"><strong>这孩子打小就喜欢物理</strong></p> <p id="4AN1GLO7">姚顺宇小时候随父母从宁夏来到上海,就读于浦东新区的上南中学东校。初三时,他在浦东新区物理竞赛中拿了个三等奖。</p> <p id="4AN1GLO9">有一说一,这成绩不算特别亮眼,我小时候拿过物理竞赛的一等奖。</p> <p id="4AN1GLOB">2012年,姚顺宇以推荐生身份被上海市格致中学提前录取,随后便开始了他开挂般的人生。</p> <p id="4AN1GLOD">2015年,他考入清华大学物理系。</p> <p id="4AN1GLOF">只不过当时没人能想到,这个物理系新生,会在10年后给整个AI界带来不小的震撼。</p> <p class="f_center"><br><br></p> <p id="4AN1GLOH"><strong>进入清华后,姚顺宇的表现开始不一样了。</strong></p> <p id="4AN1GLOJ">大二下学期,当大多数同学还在为基础课程焦头烂额时,他已经开始上博士生的凝聚态物理课程。</p> <p id="4AN1GLOL">那一年,姚顺宇被周期驱动系统(Floquet systems)吸引了。</p> <p id="4AN1GLON">这是个极其前沿的研究领域,涉及复杂的数学和物理概念。他和导师汪忠教授一起,写了篇50多页的长文章,完成了对高维、一般对称性下 Floquet周期驱动系统的拓扑分类。</p> <p id="4AN1GLOP">这项工作为这一研究方向建立了完整的理论框架,是一项非常系统的里程碑式拓扑分类工作。</p> <p id="4AN1GLOR">并且,姚顺宇以第一作者身份,将这篇论文发表在了物理学顶级期刊Physical Review B上。</p> <p id="4AN1GLOT"><strong>对一个本科生来说,这几乎是不可能完成的成就。</strong></p> <p id="4AN1GLOV">物理系主任王亚愚教授后来回忆说,在这门主要面向博士生的课程中,姚顺宇是十年来给自己印象最深的两名学生之一。</p> <p id="4AN1GLP1">但真正让姚顺宇在物理学界出名的,是他在非厄米系统方面的发现。</p> <p id="4AN1GLP3">在清华期间,他首次在国际上给出了关于非厄米系统的拓扑能带理论,并准确预测了相关现象。</p> <p id="4AN1GLP5">简单说,他发现在开放量子系统中,电子态会神奇地“挤”到材料边界,这种现象被称为“非厄米趋肤效应”(Non-Hermitian Skin Effect)。这个发现颠覆了传统拓扑物理的理论框架。</p> <p id="4AN1GLP7">这项工作发表在 Physical Review Letters 上,并获得了编辑推荐。</p> <p id="4AN1GLP9">这篇题为《Non-Hermitian Skin Effect and Chiral Damping in Open Quantum Systems》的论文,后来被引用近千次,成为姚顺宇学术影响力最高的作品。</p> <p id="4AN1GLPB">2018年11月8日,清华大学本科生特等奖学金答辩会举行。</p> <p id="4AN1GLPD">这是清华授予本科生的最高荣誉,每年全校不足十人,在这之中便有姚顺宇。</p> <p id="4AN1GLPF"><strong>他也成为了物理系当年唯一获此殊荣的学生。</strong></p> <p id="4AN1GLPH">2019年,姚顺宇去斯坦福大学读理论与数学物理博士。</p> <p id="4AN1GLPJ">他的导师是Douglas Stanford和Stephen H. Shenker。</p> <p id="4AN1GLPL">前者被同行认为是最有潜力改变物理发展方向的顶尖青年科学家,后者则是弦理论领域的传奇人物。</p> <p id="4AN1GLPN">在斯坦福期间,姚顺宇研究量子引力和量子信息扰乱(quantum scrambling),这是理论物理中最前沿、也最抽象的领域之一。</p> <p id="4AN1GLPP">博士毕业后,他在加州大学伯克利分校做博士后研究。截至目前,他的总引用次数超过5000次,h指数14。</p> <p id="4AN1GLPR"><strong>02</strong></p> <p id="4AN1GLPS"><strong>一个学物理的凭什么能研究AI?</strong></p> <p id="4AN1GLPU">虽然很多人大学选的专业,和他们毕业出来后找的工作都没有直接关联,但是像姚顺宇这样一直在钻研物理学的人,理论上应该找个物理相关的工作。</p> <p id="4AN1GLQ0">但是姚顺宇偏偏选择了AI。</p> <p id="4AN1GLQ2">2024年10月,姚顺宇加入Anthropic,参与大模型Claude Sonnet框架的研发。</p> <p id="4AN1GLQ4">一个研究量子引力的物理学者,凭什么能负责起世界顶尖AI公司的研发工作?</p> <p id="4AN1GLQ6"><strong>答案其实不复杂。</strong></p> <p id="4AN1GLQ8">大模型的核心技术本质上是数学密集型的工作。训练大模型需要解决高维空间中的优化问题,这跟物理学中的变分法、统计力学有很深的联系。</p> <p id="4AN1GLQA">姚顺宇研究的拓扑物理、非厄米系统,用的数学工具,比如概率论、线性代数、张量计算、动力系统理论,它们跟深度学习高度重合。</p> <p id="4AN1GLQC">更关键的是,理论物理和机器学习处理的是同一类问题:高维、非线性、涌现性强的复杂系统。</p> <p id="4AN1GLQE">统计物理学中的吉布斯分布,就是机器学习中概率推断的理论基础。深度神经网络的训练过程,可以看作是在高维参数空间中找能量最小值,这跟统计物理中的自由能最小化原理一个道理。</p> <p id="4AN1GLQG">近年来越来越多研究表明,统计物理的工具可以用来理解深度学习中的很多现象。</p> <p id="4AN1GLQI">量子多体系统和大模型在数学结构上很相似。</p> <p id="4AN1GLQK">在量子物理中,大量粒子相互作用时,会涌现出单个粒子层面无法预测的集体行为。</p> <p id="4AN1GLQM">在大模型中,数十亿个神经元参数相互作用时,同样会涌现出超出预期的效果。</p> <p id="4AN1GLQO"><strong>事实上现在咱们常说的思维链推理、上下文学习、指令遵循,也都是依靠这种涌现的方式才诞生的。</strong></p> <p class="f_center"><br><br></p> <p id="4AN1GLQQ">这种从微观到宏观的涌现现象,也正是物理学家最擅长研究的。</p> <p id="4AN1GLQS">因此,基于物理训练出来的“物理直觉”,恰恰是AI研究最需要的。</p> <p id="4AN1GLQU">从复杂现象中抽象出数学模型,这是物理学家的基本功。</p> <p id="4AN1GLR0">在AI领域,这意味着能理解神经网络的本质,而不是停留在调参层面。</p> <p id="4AN1GLR2">物理学家习惯在不同尺度上思考问题,从微观粒子到宏观宇宙。这种跨尺度建模的能力对应到AI中,就是理解从单个神经元到整体的全景图。</p> <p id="4AN1GLR4">姚顺宇在斯坦福研究的量子信息扰乱(quantum scrambling),关注的是量子信息如何在复杂系统中扩散和混乱化,这套数学框架跟神经网络中信息的传播和处理有相似的结构。</p> <p id="4AN1GLR6">那么当他转去做AI相关的研究时,这些看似抽象的物理理论,就顺理成章地变成了理解大模型行为的工具。</p> <p id="4AN1GLR8"><strong>更直接的联系来自强化学习这个概念本身。</strong></p> <p id="4AN1GLRA">姚顺宇在Anthropic主要做强化学习研究,而强化学习的理论基础本身就源于物理学。</p> <p id="4AN1GLRC">最优控制理论恰好是来自经典力学的变分原理,路径积分方法直接借鉴量子力学的费曼路径积分,熵正则化来自统计物理的自由能概念。</p> <p id="4AN1GLRE">对一个理论物理学家来说,这些不是需要学习的新知识,而是已经内化在思维方式里的工具。</p> <p id="4AN1GLRG"><strong>这种从物理到AI的转变,不是姚顺宇一个人的个案。</strong></p> <p id="4AN1GLRI">卷积神经网络的发明者杨立昆(Yann LeCun),在进入AI领域之前,学的就是工程物理教育。</p> <p id="4AN1GLRK">深度学习的奠基人杰弗里·辛顿(Geoffrey Hinton),他提出的玻尔兹曼机(Boltzmann Machine),名字就来自统计物理学家路德维希·玻尔兹曼。</p> <p id="4AN1GLRM">而这套系统的核心逻辑,便是用统计物理中的能量函数来描述神经网络的状态分布。</p> <p id="4AN1GLRO">事实上,姚顺宇在加入Anthropic后,深度参与了Claude 3.7 Sonnet与Claude 4系列的强化学习模块研发,是这两代模型能力跃升的关键贡献者。</p> <p id="4AN1GLRQ">这不是“跨界”,而是把物理工具应用到新领域。</p> <p id="4AN1GLRS">当AI产业逐渐从“暴力堆算力”的Scaling Law时代,转向新阶段时,反而需要这样的物理学者。</p> <p id="4AN1GLRU"><strong>03</strong></p> <p id="4AN1GLRV"><strong>新征程</strong></p> <p id="4AN1GLS1">2025年9月19日,姚顺宇在个人博客上发了篇文章,宣布离开 Anthropic。</p> <p id="4AN1GLS3">在这篇文章里,他很坦诚地说明了离职原因,并给出了一个精确的比例:40%和60%。</p> <p id="4AN1GLS5"><strong>40%指的是可以公开的原因,来自于姚顺宇和Anthropic之间价值观上的冲突。</strong></p> <p class="f_center"><br><br></p> <p id="4AN1GLS7">2025年9月5日,Anthropic在内部文件中把中国列为“adversarial nations”(敌对国家),并宣布停止向“中国实体控股的公司”提供AI服务。</p> <p id="4AN1GLS9">姚顺宇在博客中写道:“我强烈反对 Anthropic 发表的反华言论。尽管我相信 Anthropic 的大多数人都会反对这样的言论,但我认为我没有办法继续留在公司。”</p> <p id="4AN1GLSB">这段话写得很克制,但能看出他的失望和无奈。</p> <p id="4AN1GLSD">他特别强调“大多数人都会反对”,说明他理解这个政策不是来自公司内部的普遍共识,更多是外部压力和公司高层决策的结果。</p> <p id="4AN1GLSF">60%指的是那些涉及“内部的机密信息”,不可公开的信息。姚顺宇因保密协议无法详细透露。</p> <p id="4AN1GLSH">但他强调,自己“不希望经验与知识受到特定实验室偏见的限制,尤其是在核心研究已无需依赖论文发表的当下,更需要开放、平等的科研环境”。</p> <p id="4AN1GLSJ">说起来像是个笑话,但实际情况就是,<strong>在AI研究日益商业化、封闭化的今天,学术自由和开放合作正在受到越来越多限制。</strong></p> <p id="4AN1GLSL">在博客结尾,他用了句意味深长的话:“It was good with you, but it is better without you.”(和你在一起很好,但没有你更好)这句话既是对过去一年工作的肯定,也是对未来道路的期待。</p> <p id="4AN1GLSN">这件事反映了在全球AI竞争的大背景下,华裔科学家面临的复杂处境。</p> <p id="4AN1GLSP">一方面,美国有世界上最先进的AI研究资源和最优秀的科研团队。</p> <p id="4AN1GLSR">可另一方面,受地缘影响,很多华裔科学家的身份成了职业发展的障碍。</p> <p id="4AN1GLST">但故事没有在离职中结束。离开Anthropic仅10天后,姚顺宇就加入了Google DeepMind,担任高级研究科学家(Senior Staff Research Scientist),且直接进入核心Gemini团队。</p> <p id="4AN1GLSV">这速度之快,说明DeepMind早就看中了他的能力。</p> <p id="4AN1GLT1">无论是谷歌CEO皮查伊,还是DeepMind CEO哈萨比斯,他俩在国际合作方面采取了更开放的立场。</p> <p id="4AN1GLT3">尤其是后者,他一直在倡导国际合作,认为AI安全问题需要全球科学家共同努力。</p> <p id="4AN1GLT5">因此,即便同样受到美国出口管制约束,谷歌依然没有完全切断与中国研究机构的联系。</p> <p id="4AN1GLT7">加入DeepMind后,姚顺宇立即投入Gemini团队的工作。</p> <p id="4AN1GLT9">仅仅5个多月后,谷歌就推出了Gemini 3 Deep Think的重大升级。</p> <p id="4AN1GLTB"><strong>这是姚顺宇加入谷歌后参与的首个项目,成绩足以让整个AI圈震惊。</strong>文章开头处就提到,这次更新甚至让马斯克也对其称赞。</p> <p id="4AN1GLTD">Gemini 3 Deep Think在多项基准测试中刷新了纪录。</p> <p id="4AN1GLTF">比如在ARC-AGI-2测试中,它达到了84.6%的成绩。ARC-AGI是专门测试 AI 的抽象推理能力,测试的目标是检测AI在面对从未见过的新问题时,能否识别模式并找到解决方案。</p> <p id="4AN1GLTH">这种能力被认为是真正智能的标志,而不是简单的模式记忆。</p> <p id="4AN1GLTJ">Gemini 3 Deep Think的成绩,比第二名Claude Opus 4.6的68.8%高出15%,比GPT-5.2 的 52.9% 更是高出30%。</p> <p id="4AN1GLTL">在Codeforces编程平台上,Gemini 3 Deep Think获得了3455分的Elo评分,达到“传奇大师”(Legendary Grandmaster)级别,世界排名第8。</p> <p id="4AN1GLTN">这意味着在算法竞赛和系统架构方面,全世界只有7个人类程序员能超越它。</p> <p id="4AN1GLTP">在奥林匹克竞赛水平测试中,Gemini 3 Deep Think在数学、物理、化学三个学科都达到了金牌水平。</p> <p id="4AN1GLTR">更重要的是,Gemini 3 Deep Think还处理那些缺乏明确指导原则、答案不唯一、数据杂乱或不完整的现实挑战。</p> <p id="4AN1GLTT">这其实是当前所有AI都面临的短板。这些大模型虽然在标准化测试中表现出色,但面对真实世界的复杂问题时,往往表现糟糕。</p> <p id="4AN1GLTV">虽然我们无法确切知道姚顺宇在Gemini 3 Deep Think项目中具体负责了哪些工作,但从时间线上看,他在自己的X上,第一时间宣布了Gemini 3 Deep Think的发布。</p> <p id="4AN1GLU1">我个人认为,姚顺宇在Anthropic积累的强化学习经验,以及他作为物理学家对复杂系统的理解,为Gemini团队带来了新的视角和方法。</p> <p id="4AN1GLU3"><strong>04</strong></p> <p id="4AN1GLU4"><strong>两个“Shunyu Yao”的平行宇宙</strong></p> <p id="4AN1GLU6">说到Shunyu Yao,其实在AI研究圈里,有两位知名研究者都叫Shunyu Yao,发音完全一样,都跟在顶尖的AI公司做研究工作,也都毕业于清华大学。</p> <p id="4AN1GLU8">每次有关于“姚顺宇”的新闻,总有人问:“是哪个姚顺Yu?”</p> <p id="4AN1GLUA"><strong>跟本文的主角不同,另一位姚顺雨是正儿八经的计算机背景。</strong></p> <p id="4AN1GLUC">他是清华姚班毕业,普林斯顿大学计算机科学博士,曾在OpenAI工作,目前已加入腾讯。</p> <p id="4AN1GLUE">姚顺雨在AI圈的名气,要比物理学家姚顺宇更大。</p> <p id="4AN1GLUG">他提出的ReAct框架(Reasoning and Acting),是近年来最有影响力的提示工程方法之一。</p> <p id="4AN1GLUI">这个框架的核心思想是让AI“边思考边行动”,不是先完成所有推理再执行,而是在推理和行动之间交替进行,就像人类解决问题时的思维过程。</p> <p id="4AN1GLUK">ReAct论文发表于2022年10月,到2025年已经被引用超过4000次,成了提示工程领域的经典工作。</p> <p id="4AN1GLUM">姚顺雨的另一项重要贡献是思维树(Tree of Thoughts)。</p> <p id="4AN1GLUO">如果说思维链是让AI学会了“一步步思考”,那思维树就让 AI 学会了“探索多条思路”。</p> <p id="4AN1GLUQ">在面对复杂问题时,AI不再只沿着一条路径推理,而是可以同时探索多个可能的解决方案,评估每条路径的前景,然后选择最有希望的方向深入。</p> <p id="4AN1GLUS">姚顺雨在谷歌Scholar上的引用数超过15000次,远高于物理学家姚顺宇的5000次。</p> <p id="4AN1GLUU">但我认为这不奇怪,计算机科学领域的论文引用速度,本来也要比物理学快得多,而且姚顺雨的工作更接近应用层面,影响范围更广。</p> <p id="4AN1GLV0">但引用数不能完全衡量一个科学家的价值,两个Shunyu Yao都在各自领域做出了重要贡献。</p> <p id="4AN1GLV2"><strong>如果说姚顺宇是从“量子力学”出发来研究 AI,那姚顺雨就是从“让AI像人类一样思考和行动”的角度切入。</strong></p> <p id="4AN1GLV4">两个人的研究方法、思维方式、甚至用的数学工具都不一样,但他们都在用自己的方式,去实现AGI。</p> <p class="f_center"><br><br></p> <p id="4AN1GLV6">姚顺雨在腾讯的工作,目前来看,是主要集中在agent上的。他发布的论文《CL-bench》,就是一个用于评估AI agent能力的基准测试。</p> <p id="4AN1GLV8">它相当于一个给AGI研究者们明确一个方向,只要你的研究成果能在CL-bench上拿高分,那就说明你接近AGI。</p> <p id="4AN1GLVA"><strong>姚顺宇则是更为直接,因为他认为真正的智能需要理解世界的底层规律。</strong></p> <p id="4AN1GLVC">物理学提供了描述宇宙运行的数学语言,从量子力学到统计物理,从信息论到复杂系统,这些都是构建真正智能系统的理论基石。</p> <p id="4AN1GLVE">那么通过物理学,便可以让AI的智能水平更上一层楼,靠近AGI。</p> <p id="4AN1GLVG">但无论如何,没有哪一种方法是唯一正确的,没有哪一个学科能独自解决所有问题。</p> <p id="4AN1GLVI">物理学家的理论洞察和计算机科学家的工程创新,都是推动AI发展不可或缺的力量。</p> <p id="4AN1GLVK">两个Shunyu Yao,两条道路,同一个目标。</p> <p id="4AN1GLVM">就像集齐龙珠可以召唤神龙一样,或许有这么一家公司,集齐了所有的Shunyu Yao,那么它也就实现了AGI。</p>
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901