荣获“光华杯”全国一等奖,上海电信开启人工智能产教融合新里程
近日,第二届“光华杯”千兆光网应用创新大赛总决赛颁奖仪式暨千兆光网应用创新大会在深圳召开。本次大赛中,上海电信申报的《中国电信智能光网携手复旦大学超算平台,实现AI for Science》项目脱颖而出,荣获上海市唯一的全国一等奖。
(上海电信参赛项目获上海市唯一全国一等奖)
该项目由上海电信联合复旦大学和阿里云共同打造,旨在以国内高校最大的云上科研智算平台——CFFF为数字基座,为科研工作者提供强大的技术支持和计算资源。CFFF平台在为科研单位提供算力服务,满足不同场景科研需求的同时,也充分展示了上海电信光网在推动各行业融合中的主导作用,为行业数字化转型和智能化发展提供有力支持。
多点突破,树立科研智算新标杆
复旦大学智能计算平台CFFF,依托中国电信全光运力,围绕智算、超算、分层存储、统一运营运维的核心理念,构建了“1+2+1+N”的平台体系,形成一个综合型智能计算平台,在多方面方面取得重大突破。
智算方面,复旦大学智能计算平台CFFF建立了“切问”一号科学智能计算集群,采用RoCE v2高速网络,融合A100GPU和Intel 9462 CPU计算节点,不仅拥有国内首个AI + HPC异构算力集群,还包含高速分层存储集群。CPU与GPU的科学配比灵活调度,让平台资源得以充分利用,一方面提升科研效率,另一方面降低资源投入成本,在科研智算领域树立了新的标杆。
超算方面,CFFF平台建立了“近思”一号专用高性能计算集群,它采用IB高速网络,打造出面向物理领域的专属HPC集群,旨在助力基础科研的探究,构建国内具有自主知识产权的科研软件,为科学研究保驾护航。
运力方面,运用中国电信100G OTN精品长传专线和阿里云行业领先的自研传输工具,在复旦大学四校区之间构建起一张充分连接算力、存储和管理平台的全光环网。在公共云和全光运力的加持下,平台资源调度的开放性、灵活性得到提升,让每位科研人员在复旦大学的任何一个科研点都能够访问1600km之外的“切问”一号智算平台和“近思”一号超算平台。
功能方面,CFFF打造了统一身份认证、统一计量计费、统一资源管理、统一运营维护的管理平台,为资源的科学分配、模型与算力的弹性匹配提供了助力,从而进一步推动基础科研攻坚、深化产教结合。
创新驱动,支撑全球数百项科研任务
为了让数据和智能技术更好的赋能科研科教及社会发展,CFFF进一步凝聚平台、异构、模式及传输的强大合力,全面提升智慧创新力。
CFFF以其创新性平台设计,打造国家级人工智能产教融合创新平台,助力基础科研攻坚,深化产教融合,为培养能够应对千亿参数大模型研发的产业人才提供关键支持,并通过举办首届世界科学智能大赛,强化国际间的合作交流,推动全球产业的联动与创新发展。其异构智算平台的建设,大幅提升科研效率,降低资源投入成本。此外,平台首次采用公共云模式为科研单位提供算力,使得资源调度更加开放灵活,为科研人员提供了实现科研理想的机会。在传输创新方面,CFFF响应国家“东数西算”战略,打通千里之外的算力路径,建立起数据传输的极速航道,为科研工作者提供了更为高效的数据传输服务。
平台上线以来,在科研领域得到了广泛应用。基于CFFF平台,复旦大学、上海科学智能研究院、中国国家气候中心联手打造行业内首个次季节大模型“伏羲”。作为一个中短期天气预报AI大模型,“伏羲”预报精度超过欧洲中期天气预报中心确定性预报结果,并达到集合预报的水平,预报速度由小时级提升到10秒内,实现千倍加速。去年12月,“伏羲”升级版亮相联合国气候变化迪拜大会,升级版次季节大模型的预测周期比中短期天气预测大模型更长,达到45天。
顺利孵化“伏羲”等重磅科研成果背后,离不开CFFF平台的关键支持。该平台算力总规模达到28 PFlop/s,可提供超千卡的并行计算能力,支持千亿参数的大型模型训练,且仅用一天即可完成具有45亿参数的大型模型训练,这使得CFFF平台成为真正意义上的“超级计算机”。这一成就不仅在国内高校中属于先例,在国际上也领先于斯坦福大学等国际知名高校。
正因如此,CFFF平台受到全球科研人员的极大关注,也赢得更加广阔的舞台。截至2023年底,平台已支撑全球数百个课题组的科研任务,在生命科学、大气科学、材料科学、量子化学等领域,落地一系列科研成果,获得全球专家学者的肯定。
随着人工智能全栈产业链加速赋能千行百业,上海电信以CFFF智算平台为基础,持续归纳经验,凝练智算平台建设模式,让其具备可复制、可推广能力。未来,上海电信也将以创新为驱动,充分发挥算力供给充沛、产业门类齐全、应用场景丰富、人才资源集聚等优势,加快应用成果转化落地,为推动行业数智化转型、城市智慧化发展贡献力量。