在现代科学研究中,人工智能正在改变的不只是研究效力,而是科研活动本身的构造。
跟着 AI 对象在天然科学中的广泛应用,越来越多的研究可以在更短时光内完成,论文产出和引用回报也随之进步。在以揭橥数量、影响力和速度为核心指标的学术体系中,这种效力优势正在直接影响研究者的行动选择和研究偏向构造。
研究基于覆盖 1980–2025 年、跨越四切切篇天然科学论文和五百多万名研究人员的经久数据,从小我科研回报与科学整体构造两个层面,体系分析了人工智能对象在天然科学中的扩散过程及其深层影响。
研究提出的核心发明具有明白的张力:人工智能明显放大年夜了个别科学家的学术影响力,但与此同时,科学整体的研究范围和互动构造却可能正在紧缩。

论文地址:https://www.nature.com/articles/s41586-025-09922-y
对于当下火热的 AI for Science (AI4S) 范畴,这篇文章不仅是近况的描述,更是一份深刻的提示:真正的科学冲破往往产生在“数据贫瘠”或“非共鸣”的荒野。假如 AI4S 仅仅沦为“在已有大年夜数据的范畴刷榜”的对象,它将导致科学摸索的内卷化。
AI 带来的并非只有增长,还有重构
这篇论文的实验成果经由过程一系列量化分析,体系地揭示了人工智能在天然科学研究中的真实影响。
研究起首证实,人工智能在天然科学中的采取已经成为一种范围巨大年夜且赓续加快的趋势。作者在 1980–2025 年的天然科学论文中共鸣别出 310,957 篇 AI-augmented papers,占全部样本的约 0.75%,而研究覆盖的总范围达到 41,298,433 篇论文和 5,377,346 名研究者。
进一步的时光序列分析显示,在传统机械进修、深度进修和生成式 AI 三个阶段中,论文和研究者采取 AI 的速度均持续加快。具体来看,1980 到 2025 年间,AI 论文占比在不合学科中上升了数十倍,例如地质学上升 10.70 倍,生物学上升 51.89 倍。
与此同时,采取 AI 的研究者占比增长得更快,在地质学中达到 135.46 倍,在物理学中高达 362.16 倍。这些成果起首注解,AI 在天然科学中的扩散是一种体系性变更,而非个别范畴的偶发明象。

这些结论基于大年夜范围样本分析得出。在包含 5,377,346 名研究者的数据中,六个天然科学学科里采取 AI 的研究者,其年均揭橥量均明显高于未采取者,且统计考验成果达到 P < 0>
在研究偏向上,徐丰力传授重要存眷基于数据驱动和人工智能的办法来建模复杂信息体系和人类行动模式,尤其聚焦大年夜说话模型、社会行动计算、城市科学等交叉范畴。

同时,AI 研究的常识分布加倍集中,研究留意力更轻易聚焦在少数核心问题上。在学术互动方面,引用同一篇论文的后续研究之间,彼此互动的程度平均削减 22%,注解 AI 研究更轻易环绕少数核心成果展开,而不是形成互相连接的新研究收集。
引用分布分析进一步显示,AI 研究中前 22.20% 的论文获得了 80% 的引用,前 54.14% 的论文获得了 95% 的引用,其引用不平等程度以 Gini 系数量化后为 0.754,明显高于非 AI 研究的 0.690。综合这些成果,论文用数据清楚地注解,AI 在明显晋升个别科研回报的同时,也使科学研究在整体层面变得加倍集中,学术互动削减,摸索空间随之紧缩。

从大年夜范围文献数据中,构建研究样本
这项研究的实验设计可以懂得为一条从辨认、对比到构造测量的完全分析流程。
研究团队起首以 OpenAlex 数据库中的天然科学论文和研究人员收集作为总体样本,主分析范围为 41,298,433 篇论文和 5,377,346 名研究人员,时光跨度覆盖 1980–2025 年,并按照机械进修、深度进修和生成式 AI 三个阶段进行划分。
研究团队克意将分析重点放在天然科学中把 AI 作为研究对象的成果,而不是计算机科学或数学中开辟 AI 办法本身的研究,从而确保研究对象是 AI 对科学临盆方法的外溢影响,而非 AI 学科内部的技巧演变。
然而,效力的晋升并不必定意味着科学摸索的拓展。当 AI 更擅长处理数据充分、问题明白、路径成熟的研究义务时,科研活动是否会整体性地向这些偏向集中,从而改变科学常识的分布构造和演变方法,这是一个经久存在但缺乏体系证据的问题。个别层面的成功是否真的可以或许累积为集体层面的进步,在 AI 深度介入科研之后,反而变得加倍值得从新核阅。
在个别科学家层面,实验成果显示 AI 的采取与科研回报之间存在明显接洽关系。论文给出的核心结论是,应用 AI 的科学家,其论文揭橥数量平均是未应用者的 3.02 倍,获得的引用数量平均是未应用者的 4.84 倍,并且在职业成长上更早成为研究负责人,时光平均提前约 1.37 年。
在这一问题背景下,清华大年夜学 FIB 实验室牵头开展了一项大年夜范围实证研究,论文题为《Artificial Intelligence Tools Expand Scientists’ Impact but Contract Science’s Focus》并已被 Nature 正刊收录。
在区分 AI 与非 AI 研究时,研究团队没有采取关键词匹配的办法,而是对预练习的 BERT 说话模型进行两阶段微调,分别在论文标题和摘要上练习模型,并将两者集成为同一的辨认器,以削减工资选择触发词所带来的误差。
为验证这种辨认方法的靠得住性,研究人员组织具备相干背景的专家对随机抽样论文进行盲审标注,成果显示专家之间的一致性 Fleiss’ κ 达到 0.964,而模型在以专家标注为真值的评估中 F1 值达到 0.875。这一步为后续所有分析供给了关键前提,即 AI 与非 AI 研究成果的划分具有足够的精确性和稳定性。

在小我层面的分析中,研究团队重要应用研究人员的年度论文揭橥数量和年度引用数量来衡量科研产出与学术影响力,并结合职业阶段变更来描述研究人员从 junior 阶段改变为 established 或 leader 的过程。基于这些指标,研究人员得出了应用 AI 的科学家发文数量增长 3.02 倍、引用数量增长 4.84 倍,并且更早成为研究负责人的结论,这些成果在不合学科中表示出一致的明显性。

在集体层面的分析中,研究团队经由过程两类指标来量化科学构造的变更。第一类是常识广度,研究人员应用 SPECTER 2.0 将研究成果映射到 768 维语义空间中,并将一组抽样成果在该空间中所覆盖的最大年夜距离定义为常识广度,用以比较 AI 与非 AI 研究在主题覆盖范围上的差别。


第二类是后续互动,研究人员将引用同一项原始研究的后续成果视为一个整体,统计这些成果之间的互相引用密度,成果发明 AI 研究的后续互动削减约 22%。研究团队据此指出,AI 研究更轻易环绕少数热点核心成果形成放射式构造,而不是像新兴研究范畴那样形成互相连接、赓续扩大的研究收集。
被效力机制挤出的摸索空间
这项研究的意义不在于简单地得出人工智能好或不好的结论,而在于研究团队用体系的数据指出了一个更深层的问题:人工智能在明显晋升小我科研收益的同时,可能正在改变科学整体进步的方法,并且这种改变未必是幻想的。
研究人员发明,应用 AI 的科学家在小我层面获得了异常明白的好处,包含论文揭橥数量增长 3.02 倍、引用数量增长 4.84 倍,以及平均提前 1.37 年成为研究负责人。但与此同时,在整体层面,科学研究覆盖的常识范围却紧缩了 4.63%,研究之间的互动也削减了 22%。这些数据合营注解,小我影响力的扩大年夜,正在伴跟着集体摸索范围的缩小。
进一步来看,研究团队并不认为这种现象是因为研究人员变得不尽力或缺乏创造力,而是指出了一种更实际的机制。当人工智能更轻易在数据充分的研究偏向上带来更高效力和更好表示时,研究人员在理性选择下,天然会把更多时光和资本投入这些偏向。雷峰网
成果是,科学研究赓续在数据丰富的范畴中被加快、优化和反复,而那些数据稀缺、但可能更基本、更具开创性的研究问题,则更轻易被边沿化。研究人员还发明,一些直觉上可能重要的身分,例如研究主题本身是否热点、早期影响力大年夜小或是否获得优先赞助,与这种集中趋势的关系并不明显,比拟之下,数据是否轻易获得更可能是推动 AI 集中应用的关键原因。
基于这些发明,研究团队对科研政策和 AI for Science 的成长偏向提出了提示。假如学术评价体系和资本分派机制持续重要嘉奖更快产出和更高引用,那么人工智能带来的小我鼓励会被进一步放大年夜,而科学整体层面的研究集中、互动削减和摸索范围变窄,也可能随之加剧。
换句话说,人工智能可能会让科学研究变得越来越高效,但同时也可能让科学摸索变得越来越保守,这恰是研究团队欲望经由过程这项研究引起存眷的核心问题。雷峰网("大众,"号:雷峰网)
项目背后的科研力量
这篇论文的一作是郝千越,他今朝是清华大年夜学电子工程系的博士研究生,研究偏向重要集中在人工智能范畴,包含强化进修和大年夜说话模型等偏向。
本科阶段,郝千越同样就读于清华大年夜学电子工程系,在博士阶段持续从事人工智能办法及其应用相干的研究工作。在科研成果方面,他在 NeurIPS、KDD 等国际顶级人工智能会议和期刊上揭橥过多篇论文,个中多项工作获得 Spotlight 等承认。

参考材料:https://haohaoqian.github.io/
这篇论文的通信作者之一是徐丰力。徐丰力现任清华大年夜学电子工程系助理传授、博士生导师,于 2023 年入职清华大年夜学,在该系开展人工智能、数据科学、社管帐算与复杂收集等偏向的研究工作。他早期在清华大年夜学获得工学博士学位,随后曾在喷鼻港科技大年夜学和芝加哥大年夜学从事博士后研究。
今朝,他已在 Nature Communications、Nature Human Behaviour、PNAS 等顶级综合性学术期刊,以及 NeurIPS、KDD、WWW 等国际会议上揭橥多篇高程度论文,并获得吴文俊人工智能优良青年奖、CAAI 社管帐算新星学者奖、微软学者奖研金等多项学术荣誉。
参考材料:https://fenglixu.github.io/
这篇论文的别的两位通信作者分别是清华大年夜学的李勇传授和芝加哥大年夜学的 James Evans 传授。
个中,李勇是清华大年夜学电子工程系的长聘传授、博士生导师,并担负城市科学与计算研究中间负责人,是教导部长江学者。他经久从事人工智能、数据科学、复杂体系与社管帐算等交叉学科研究,主持了多个国度重点研发筹划和国度天然科学基金重点项目。
然而,当研究视角从小我扩大到整体科学生态时,实验成果出现出相反的趋势。研究人员经由过程将论文嵌入到 768 维的科学语义空间中,并测量论文集合覆盖范围,发明 AI 研究在整体上的常识广度明显小于非 AI 研究,在六个学科中位数平均紧缩 4.63%,且在细分到 200 多个子范畴后,这种紧缩仍然在 70% 以上的子范畴中存在。
他曾入选全球高被引科学家、国度万人筹划青年拔尖人才,获得教导部科技进步一等奖、IEEE ComSoc 亚太出色青年学者奖、吴文俊人工智能优良青年奖等多项荣誉,同时也担负多个国际会议筹委会成员和国际期刊编委。

参考材料:https://fi.ee.tsinghua.edu.cn/~liyong/
James Evans 是芝加哥大年夜学社会学系的 Max Palevsky 传授,同时担负该校 Knowledge Lab 的主任和计算社会科学项目标学术负责人,并在 Santa Fe Institute 等机构任客座或外部传授。他的研究重点是懂得常识与集体思维体系的形成与演变机制,包含留意力分布、思惟来源、共享思维模式、协同与争议过程,以及肯定性与不肯定性如安在群体中积聚。
在研究办法上,James Evans 常应用大年夜范围数据、机械进修和生成模型等对象来商量人类懂得与立异的集体机制。他的研究成果揭橥在 Nature、Science、PNAS 等顶级学术期刊,并经常受到 The New York Times、The Economist、BBC、CNN 等国际媒体的存眷与报道。此外,James Evans 还经久在学术界从事编辑、评论和项目指导等工作。
在科研成果方面,李勇传授在人工智能和数据科学偏向积聚了丰富研究成果,在 Nature Computational Science、Nature Machine Intelligence、Nature Human Behaviour、Nature Cities 等综合性期刊,以及 ACM KDD、NeurIPS、ICLR、WWW 等国际会议上揭橥了大年夜量高程度论文,累计引用跨越三万多次,并拥有多项授权专利。

James Evans 参考材料:https://sociology.uchicago.edu/directory/james-evans
值得一提的是,研究团队并未止步于对问题的辨认和诊断,而是测验测验在实践层面回应这一构造性挑衅。环绕人工智能在科研中可能加剧研究集中、紧缩摸索空间的风险,徐丰力、李勇传授团队进一步提出了一种面向将来科研范式的解决思路,推出了一个强调全流程协同与跨学科摸索的科研智能系一切 OmniScientist(拜访网址:OmniScientist.ai)。

拜访地址:OmniScientist.ai
与将 AI 仅作为单点对象嵌入科研流程不合,OmniScientist 试图将人工智能引入科研问题定义、文献懂得、假设生成、办法设计和成果分析等多个关键环节,经由过程多智能体协作的方法,赞助研究者体系性地拓展研究视角,降低跨范畴摸索的门槛,从而缓解单一数据密集偏向对科研路径的过度吸引。
某种意义上,OmniScientist 恰是对论文所揭示问题的直接回应,即在承认 AI 明显晋升科研效力的同时,测验测验经由过程更具构造意识的设计,引导人工智能办事于更广泛、更具摸索性的科学研究目标。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复