6月27日,国内高校最大的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线。这台为发现和解决复杂科学问题而建的科研“超级计算机”由复旦大学与阿里云、中国电信共同打造,以公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练。
根据此前的招投标公告,CFFF专用计算平台的整体系统组成如下:集群系统包含登录管理节点、高性能超级计算机(包括GPU计算节点-前期已购置和本次购置的、CPU计算节点、胖节点、国产CPU计算集群和超融合集群)等计算设备、存储系统(包括高速存储系统-全闪、混闪-和低速存储系统-温存、磁带库)、网络系统(包括高速计算网络、管理业务网络、带外管理网络、校内网对接网络),虚拟机系统、安全设备、集群统一管理、集群统一登录门户网站、作业调度系统、并行开发环境等全套软硬件,机房托管,跨校区大数据传输网系统等。
据介绍,部署在复旦校内的“近思”一号是专用高性能计算集群,托管在1500公里外阿里云乌兰察布数据中心的“切问”一号将面向多学科融合创新的AI for Science。
目前,CFFF平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院李昊团队近期发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了3秒内。“基于CFFF平台的千卡并行智能计算,这样一个规模的大模型只用一天就完成了训练。传统的计算平台是很难做到的。”李昊说。
“随着大数据资源的不断增长,随着需要求解的科学问题日益复杂,引发了对于科学研究‘第五范式’的探索,即在数据范式的基础上,引入智能技术,强调人的决策机制与数据分析的融合,将数据科学和计算智能有效结合起来。”复旦大学校长、中国科学院院士金力认为,人工智能在科学研究中的地位,要从科研范式变革的角度去看。传统科研范式已经历了四个阶段的演化发展历程,从通过实验描述自然现象的经验范式,到通过模型或归纳进行研究的理论范式,到应用计算机仿真模拟解决学科问题的计算范式,发展到了通过大数据分析研究事物内在关系的数据范式。
未来,CFFF平台还将持续扩大其算力规模,并向复旦校外的科研机构、高校、医院、高科技企业等开放。当天,面向全球科研人员的首届世界科学智能大赛也宣布正式启动,大赛设置生命科学、量子化学等五大赛道,CFFF平台将为参赛队伍提供免费训练算力,并以更普惠的算力长期支持部分科研项目。