填补行业空白,科大讯飞助推“智算运维标准化”建立

查股网  2024-12-25 17:49  科大讯飞(002230)个股分析

填补行业空白

科大讯飞助推“智算运维标准化”建立

据工信部等六部门联合印发的《算力基础设施高质量发展行动计划》发展目标,我国2023-2025年算力规模复合增长率预计达到18.5%,2024年新增算力规模将接近40EFlops,算力核心产业规模有望突破2.4万亿元。算力的“爆发式”增长,使得智算中心已成为数字经济增长、带动数字产业化发展、助推产业数智化转型升级的“超级工厂”。然而,技术层面的不断革新、服务流程的不断重构、应用层面需求的快速崛起,“超级工厂”在算力使用效率、故障管理难度、资源监控精度、资源需求匹配难度、全局可观测性和运维沉没成本等方面也有着更高的要求。2023年10月24日,科大讯飞发布了国内首个全国产算力平台“飞星一号”,真正意义上突破和实现了技术的自主可控。业界尤其是国产化算力领域,当前缺乏体系化设计来指导集群的长稳训练,因此,科大讯飞联合华为智算运维团队对集群稳定性运维进行专项攻关,以大模型训练黄金指标体系为起点,共同打造“智算运维体系”中国信息通信研究院认为这一“智算运维体系”的建立,填补了智算运维领域空白标准。该套标准从底层基础设施、到算存网、再到AI工程化,全方位梳理影响集群长稳的关键指标,并通过流程优化和平台构建来快速定位和解决问题。在该套标准执行下,科大讯飞自研超大集群智能运维和调度系统,保障“飞星一号”从2023年10月上线至今,基础设施零重大故障,计算设备集群性能也从 30%提升到95%,软硬件故障均收敛,NPU月均利用率平均可达95%以上,故障自动重训率97%以上,中断损失时长30分钟以下,算力可用度98%以上,已常态化支持星火大模型的高效训练。

国产算力突围智算集群规模跃迁搭乘“飞星”加速度

作为首个国产万卡智能算力集群,“飞星一号”助力多个地方智算中心构筑了坚实可靠的“算力底座”。

在利川,基于“飞星一号”自主创新的算力底座,为政府、企业、高校、科研院所等提供智能算力、模型训练以及运营服务。在此基础上孵化的“利川文旅大模型”,结合算力底座训练工具链与利川产业优势,将文旅行业与人工智能深度结合,赋能广大游客、文旅企业与政府机构,促进文旅产业智慧化升级和高质量发展。

在竹溪“飞星一号”为“国芯一号”注入新动能。全栈自主创新算力底座,为竹溪政务大模型、农业大模型等提供了算力“温床”,助力政务、农业、文旅研学等领域创新发展,繁荣当地数字产业生态。

在温州,“飞星一号”为开源开放的城市AI公共服务平台提供了坚实的算力底座,助力凝聚产业链上下游的各方力量,加速大模型技术的创新和工程化进程。

在沈阳,“飞星一号”推进大东区数字产业与传统产业融合发展,让更多的人工智能应用在“老工业”与“新产业”中落地生花。

2024年10月24日,“飞星二号”宣布正式启动,其算力规模将是“飞星一号”的4倍以上。在需求不断变化和技术迭代革新的当下与未来,“飞星二号”将会持续适配新模型新算法,实现智算集群规模的再次跃迁。

*文中数据来源于项目实际应用

(转自:科大讯飞集团)