中国工程院院士、云计算技术专家、之江实验室主任王坚在“人工智能赋能科学研究”研讨会(AI4S大会)发言时指出,“赋能”这个词是低估了人工智能对科学的颠覆,人工智能不是一次工具的革命,是一次科学革命的工具或者是科学革命性的工具。
王坚认为,人工智能不仅仅是增强了科学研究的工具,它本身就是科学研究方法的一部分,是推动科学革命的关键因素。因此,人工智能的应用不仅仅是工具的升级,而是科学研究方式和思维方式的根本变革。
在讨论科学范式时,王坚提到了第三范式(计算机模拟)、第四范式(数据驱动)和第五范式(与人工智能密切相关)。这些范式的提出,体现了科学研究方法的发展和进步。第三范式虽然引入了计算机模拟,但其影响尚未完全深入;而第四范式和第五范式则更加注重数据和人工智能的作用。
王坚总结,人工智能如果最简单地讲,就是数据碰上了模型,模型碰上了计算,也就是“数据+模型+计算”。“从这个角度来讲,事实上互联网是所有这些东西的基础,当然现在人工智能包括数据、模型和计算都跟互联网非常相同一致,甚至说是一模一样的特征,所以当时互联网之所以不是网络或者是简单的网络,就是因为它的规模”。
开源从以代码为核心 转变为科技资源的全面开放
王坚认为,DeepSeek出现,给开放带来了深刻的变化。“过去两年,我提到的‘开源’理念,在DeepSeek的出现后得到了验证。传统的开源以代码为核心(Open Source Code),但如今已简化为‘开源’,其本质逐渐扩展。在人工智能阶段,知识与财富已不再局限于源代码。”
因此,王坚提出“Open Resource Innovation”这一概念,即科技资源的全面开放。科技资源不仅包括代码,还涵盖数据、方法论等多方面内容。“我非常提倡开源的精神,这是一个人、一个机构、一个国家对社会甚至全世界的贡献。到了人工智能阶段,到了数据时代,已经不能仅用简单的Open Source Code来表达,因为最重要的财富、知识已经不是只通过Source Code体现。今天的创新具有非常大的特点,我把它叫做Open Resource Innovation,也就是说要把科技资源开放出来。”
权重已成为一种重要资源
大语言模型权重是指在大语言模型(Large Language Models,LLMs)中用于计算和生成文本的参数集合。这些权重是模型通过大量文本数据训练得到的,它们决定了模型在处理自然语言时的行为和性能。大语言模型权重包括参数、训练过程、表示学习等核心内容。控制这些模型的权重,意味着在一定程度上能够影响其他国家的技术进步和经济发展。
2025年1月13日,美国发布迄今为止采取的最严厉的出口管制措施——“人工智能扩散临时最终规则”(Interim Final Rule on Artificial Intelligence Diffusion)。新规 禁止将人工智能关键技术外包 ,确保人工智能按照美国标准执行,对一些国家的先进人工智能芯片数量设定上限,并要求美国企业出口人工智能技术和芯片时必须获得许可。此外,美国在出口管制中首次将大语言模型权重纳入管控范围,这表明权重已成为一种重要资源。
“开放权重不仅是技术进步的关键,更是科研资源共享的重要体现。当前,无论是在世界还是在中国,我们正处在一个开放资源创新的时代,中国在此领域拥有独特机会,DeepSeek通过MIT许可协议开放资源,为全球提供了示范。”王坚总结,“当前科研体系趋于固化甚至垄断化,成为发展中国家及更多参与者的壁垒。因此,开放科学旨在重新构建科研体系,探讨如何进行科学研究和交流。虽然开放科学讨论已久,但其背后逻辑复杂,人工智能已成为探讨这一问题的重要手段。”
值得肯定的是,王坚提出的开放资源创新概念,强调了科技资源的全面开放,包括代码、数据、方法论等,这是对传统开源概念的重要扩展。这种开放性不仅推动了科技的发展,还打破了学科之间的壁垒,使得科学研究更加普及和民主化。
最后,王坚提到从STEM(即科学、技术、工程、数学)到STE+MAP(Medical医学、艺术、哲学的转变,以及“大科学计划”中的公共产品理念,都指向了科学研究的新方向。STE+MAP的教育理念更加注重跨学科的学习和研究。在这个方向上,人工智能、数学和基础设施的结合将创造出面向全世界的科学研究公共产品,从而推动科技创新的资源更加开放和共享。
一审:周书勤 二审:赵婧 三审:赵苗苗 原文链接:https://mp.weixin.qq.com/s/6dqGT_D5oCjltwGcijlm-Q

