想象一下,以往需要3-5天才能完成的文献综述,现在20分钟就能搞定;复杂的跨学科研究,AI能自动帮你调用300多个专业工具...这不是科幻,而是中国科学家刚刚实现的突破!
2025年7月26日在上海2025世界人工智能大会上,中国科学院联合团队正式发布全球首个面向跨学科科研的智能底座—"磐石·科学基础大模型"。这一突破性成果标志着中国在"人工智能+科学"领域迈入国际领先行列,为科学家提供从假设提出到规律发现的全程AI赋能,被誉为科研界的"跨学科操作系统"。
现代科学研究面临的最大挑战之一,是不同学科间的"数据孤岛"与"工具壁垒"。以药物研发为例,科学家往往需要融合基因组学、蛋白质结构学、化学合成等多个领域的数据与工具,而这些资源通常散落在不同的数据库和软件中,格式各异,互不兼容。
"磐石·科学基础大模型"的诞生,正是为了解决这一难题。它采用异构混合专家架构(MoE),在国产开源大模型的基础上深度定制,集成了自主研发的一系列面向共性科学数据模态的专用模型,并融合了AlphaFold、MatterGen等国际知名的专业领域模型。
这种架构可以通俗地理解为一个"专家委员会"—当模型接收到一个任务,比如预测蛋白质结构,它会自动将任务分配给专精于此的"蛋白质折叠专家";当任务是解析化学物质光谱时,则会调用"化学分析专家"。
"磐石"大模型已系统掌握数学、物理、化学、材料科学、生物学和天文学六大学科的核心定理、定律与专业知识,并实现了对波、谱、场等多种科学模态数据的深入理解。在基础学科领域的国际通用数据集中,该模型的表现尤为突出,达到了当前最佳性能。
基于"磐石"大模型,研发团队还开发了两个科学智能体:
"磐石·文献罗盘":已接入1.7亿篇科技文献与实时开源科技信息,可深度理解包含公式与图表的科学数据。以往需要3到5天才能完成的文献调研工作,现在可缩短至20分钟。
"磐石·工具调度台":可自主规划及调用超过300个科学计算工具,自动识别科研任务、智能编排最优工具链,大幅降低科研门槛。
在生命科学领域,团队依托"磐石"构建了X-Cell数字细胞大模型,实现了从基因序列到细胞表型的整体建模。以蛋白质相互作用的药物靶点发现为例,相比传统范式,科研效率加速超过10倍。
在高能物理领域,北京正负电子对撞机的研究人员利用该模型实现粒子物理研究任务的自动分解与高效规划,显著提升粒子模拟速度与重建效率。
在力学研究领域 ,高效计算高铁模型在多种流体环境下的表面压力场,为高铁构型设计提供数据支持。
在化学与天文领域,在分子结构预测中实现更准确的结果,并在天文观测中实现智能化的全球资源调度。
目前,"磐石·科学基础大模型"已全面开源,科研工作者可通过官网(https://scienceone.ia.ac.cn)访问使用。
"磐石·科学基础大模型"的发布,不仅解决了科研领域长期存在的碎片化难题,更将AI从"工具"升级为"科研伙伴"。未来,科学家与AI的协同共创,无疑将加速人类解开生命奥秘、攻克重大疾病的步伐,开启一个科学发现无限可能的新纪元。