经营分析☆ ◇688802 沐曦股份 更新日期:2026-04-18◇ 通达信沪深京F10
★本栏包括【1.主营业务】【2.主营构成分析】【3.前5名客户营业收入表】【4.前5名供应商采购表】
【5.经营情况评述】
【1.主营业务】
研发、设计和销售应用于人工智能训练和推理、通用计算(包括科学计算)与图形渲染领域的全栈GPU产品
,并围绕GPU芯片提供配套的软件栈与计算平台
【2.主营构成分析】
截止日期:2025-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
集成电路行业(行业) 16.44亿 100.00 9.29亿 100.00 56.51
─────────────────────────────────────────────────
GPU产品及配件(产品) 16.31亿 99.19 9.16亿 98.59 56.17
IP、技术服务及其他(产品) 1333.90万 0.81 1310.18万 1.41 98.22
─────────────────────────────────────────────────
中国内地(地区) 16.42亿 99.85 9.27亿 99.83 56.49
中国香港(地区) 247.58万 0.15 158.78万 0.17 64.13
─────────────────────────────────────────────────
经销(销售模式) 8.76亿 53.31 5.18亿 55.78 59.13
直销(销售模式) 7.68亿 46.69 4.11亿 44.22 53.51
─────────────────────────────────────────────────
截止日期:2025-03-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
训推一体GPU板卡(产品) 3.13亿 97.55 1.76亿 99.22 56.21
智算推理GPU板卡(产品) 400.75万 1.25 25.53万 0.14 6.37
其他(产品) 256.50万 0.80 41.54万 0.23 16.20
训推一体GPU服务器(产品) 104.03万 0.32 45.34万 0.26 43.59
IP授权(产品) 25.00万 0.08 --- --- ---
─────────────────────────────────────────────────
中国内地(地区) 3.20亿 99.84 1.77亿 99.84 55.26
中国香港(地区) 50.03万 0.16 28.18万 0.16 56.32
─────────────────────────────────────────────────
经销模式(销售模式) 1.78亿 55.71 8729.29万 49.30 48.90
直销模式(销售模式) 1.42亿 44.29 8976.06万 50.70 63.25
─────────────────────────────────────────────────
截止日期:2024-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
训推一体GPU板卡(产品) 5.12亿 68.88 3.25亿 81.85 63.50
训推一体GPU服务器(产品) 2.10亿 28.25 6653.72万 16.76 31.70
其他(产品) 1684.56万 2.27 416.81万 1.05 24.74
智算推理GPU板卡(产品) 349.08万 0.47 35.23万 0.09 10.09
IP授权(产品) 100.00万 0.13 --- --- ---
─────────────────────────────────────────────────
中国内地(地区) 7.25亿 97.62 3.88亿 97.82 53.54
中国香港(地区) 1650.58万 2.22 840.09万 2.12 50.90
其他业务(地区) 116.29万 0.16 25.86万 0.07 22.24
─────────────────────────────────────────────────
直销模式(销售模式) 4.64亿 62.49 2.32亿 58.31 49.86
经销模式(销售模式) 2.78亿 37.36 1.65亿 41.63 59.54
其他业务(销售模式) 116.29万 0.16 25.86万 0.07 22.24
─────────────────────────────────────────────────
截止日期:2023-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
IP授权(产品) 2216.67万 41.81 --- --- ---
训推一体GPU板卡(产品) 1546.81万 29.17 1012.81万 30.38 65.48
智算推理GPU板卡(产品) 1376.32万 25.96 73.96万 2.22 5.37
其他(产品) 162.31万 3.06 30.47万 0.91 18.78
─────────────────────────────────────────────────
中国内地(地区) 5141.09万 96.96 3303.97万 99.10 64.27
其他业务(地区) 161.02万 3.04 29.94万 0.90 18.59
─────────────────────────────────────────────────
直销模式(销售模式) 2888.86万 54.49 2232.61万 66.97 77.28
经销模式(销售模式) 2252.23万 42.48 1071.36万 32.14 47.57
其他业务(销售模式) 161.02万 3.04 29.94万 0.90 18.59
─────────────────────────────────────────────────
【3.前5名客户营业收入表】
截止日期:2025-12-31
前5大客户共销售10.10亿元,占营业收入的61.46%
┌───────────────────────┬───────────┬───────────┐
│客户名称 │ 营收额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│合计 │ 101045.60│ 61.46│
└───────────────────────┴───────────┴───────────┘
【4.前5名供应商采购表】
截止日期:2025-12-31
前5大供应商共采购14.50亿元,占总采购额的82.34%
┌───────────────────────┬───────────┬───────────┐
│供应商名称 │ 采购额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│合计 │ 145028.40│ 82.34│
└───────────────────────┴───────────┴───────────┘
【5.经营情况评述】
截止日期:2025-12-31
●发展回顾:
一、报告期内公司所从事的主要业务、经营模式、行业情况说明
(一)主要业务、主要产品或服务情况
公司致力于自主研发全栈高性能GPU芯片及计算平台,主营业务是研发、设计和销售应用于人工智能训
练和推理、通用计算(包括科学计算)与图形渲染领域的全栈GPU产品,并围绕GPU芯片提供配套的软件栈与
计算平台。自成立以来,公司始终专注于GPU产品的技术创新和迭代升级,形成了独具优势的GPU产品体系和
自主开放的软件生态,持续为云端计算提供高能效、高通用性的算力支撑,推动人工智能赋能千行百业,重
点布局了教科研、金融、交通、能源、医疗健康、大文娱等行业应用场景以及“具身智能”、“低空经济”
等前沿方向,已成为推动我国智能算力基础设施自主可控的重要力量。作为国内高性能GPU产品的主要领军
企业之一,公司将秉持“不负历史,为民族复兴、国家强盛贡献科技力量”的使命,不断打造行业领先的GP
U核心产品,助力数字经济发展。
自成立以来,公司始终以推动我国智能算力产业链自主可控为己任,长期聚焦和深耕GPU与人工智能行
业,聚合了一支深刻洞察全球GPU行业技术发展趋势、拥有顶尖GPU技术及全流程量产经验、具备持续自主创
新能力的技术研发团队。通过不懈的技术攻坚,公司已成为了国内少数几家系统掌握了高性能GPU芯片及其
基础系统软件研发、设计和量产技术的企业之一,深度积累了GPUIP(包括指令集、微架构等)、GPUSoC、
高速互连、GPU软件等核心技术,成功突破了高性能GPU芯片及计算平台的技术瓶颈。
公司的主要产品全面覆盖人工智能计算、通用计算(包括科学计算)和图形渲染三大领域,公司先后推
出了用于智算推理的曦思N系列GPU、用于训推一体和通用计算的曦云C系列GPU,以及正在研发用于图形渲染
的曦彩G系列GPU。公司的GPU产品基于自主研发的GPUIP与统一的GPU计算和渲染架构,在通用性、单卡性能
、集群性能及稳定性、生态兼容与迁移效率等方面具备较强的核心竞争力,产品综合性能已处于国内领先水
平。围绕高能效、高通用的GPU产品,公司打造了自主开放、高度兼容国际主流GPU生态(CUDA)的软件生态
体系,具备易用性和可扩展性。软硬件的深度协同确保了公司产品性能的高效释放,为公司塑造了深厚的竞
争壁垒。
从产品形态来看,公司从事GPU芯片的设计,由晶圆制造厂和封装测试厂完成芯片的生产,并由板卡厂
商完成GPU芯片和板卡的集成,最终形成完整的GPU板卡/模组。针对不同客户的需求,除交付内嵌GPU芯片的
板卡/模组外,公司亦可向客户交付集成多个板卡后的服务器、一体机/工作站,以及由多个服务器、存储设
备、网络设备等组成的智算集群,配以兼容主流GPU生态(CUDA)的MXMACA软件栈,为客户提供综合算力解
决方案,具备高能效和高通用性的天然优势。
(二)主要经营模式
公司自成立以来一直采用Fabless经营模式,即专注于GPU芯片的研发、设计和销售,将晶圆制造、封装
测试等其余环节委托给相关制造企业及代工厂完成。公司具体的盈利、研发、采购、生产及销售模式如下:
1、盈利模式
公司主要通过向客户销售GPU板卡及集成自身GPU板卡的硬件产品获得业务收入。公司训推一体GPU板卡
及智算推理GPU板卡收入为公司向客户提供相应板卡产品获取的收入。在上述业务中,公司GPU板卡生产销售
的业务流程与传统Fabless模式一致,即公司负责芯片设计工作,生产制造环节主要委外代工,代工厂完成
板卡生产后交付公司,公司销售后取得业务收入。GPU服务器收入为公司根据行业客户的具体应用场景需求
,向客户交付集成自身GPU板卡后的服务器、一体机/工作站等硬件取得的收入。
2、研发模式
公司高度重视GPU芯片关键技术研究和产品开发,秉持以客户需求为导向的核心原则,构建了基于IPD管
理理念的产品研发体系,实现了从概念阶段、可行性与计划阶段、产品开发阶段、新产品导入阶段到量产阶
段的全过程技术与质量管控,有效地保障了产品的技术先进性和交付质量。
3、采购和生产模式
公司是典型的Fabless模式企业,主要负责制定GPU芯片的规格参数与方案、完成芯片的架构设计、核心
IP开发、封装设计、物理设计、设计验证,交付GPU芯片设计版图等,而GPU芯片的晶圆加工、封装测试通过
委外方式完成。公司向晶圆制造厂采购定制加工生产的晶圆,向封装测试厂采购封装测试服务,向加工厂商
采购板卡加工服务,期间公司辅以工艺管理和测试支持。针对部分客户的解决方案需求,公司在使用已经加
工完毕的GPU板卡产品的基础上,根据客户的具体需求采购相应配套的服务器、存储设备及网络设备等硬件
。
4、销售模式
报告期内,公司采用直销与经销结合的模式进行产品销售。公司内部设置专门的销售团队与客户进行需
求沟通。在直销模式下,公司直接参与客户的公开招标或商务谈判,达成意向后与客户签订销售合同;公司
接收客户的采购订单后,根据订单进行产品发货,并向客户提供售后技术支持等服务;在经销模式下,经销
商采购公司产品并向其下游客户进行销售,公司向经销商提供相应的技术培训和技术支持。
(三)所处行业情况
1、行业的发展阶段、基本特点、主要技术门槛
(1)行业发展阶段及基本特点
根据国家统计局《战略性新兴产业分类(2018)》,公司所处行业为“1新一代信息技术产业/1.3新兴
软件和新型信息技术服务/1.3.4新型信息技术服务/6520集成电路设计”。公司GPU产品主要服务于人工智能
产业链,与人工智能及半导体产业的发展密切相关。近年来,全球集成电路产业进入了由人工智能、大数据
、5G等技术驱动的新一轮成长阶段,不断加速AGI(通用人工智能)、自动驾驶、数字孪生等创新性终端应
用的商业化落地进程。大模型的爆发引燃了GPU市场巨变,智算中心资本投入急剧增长,GPU在计算领域的应
用快速超越其在图形渲染领域的应用,带动GPU整体市场规模高速增长。根据VerifiedMarketResearch的数
据,2024年全球GPU市场规模为773.9亿美元,2030年有望达到4,724.5亿美元。
中国GPU市场拥有庞大的消费群体,伴随国家政策大力扶持、国内人工智能产业链各重要环节技术的不
断成熟,国产GPU厂商迎来关键发展机遇。根据弗若斯特沙利文数据,2024年中国AI加速芯片市场规模约为1
,425.37亿元,同比增长98.49%,2025年中国AI加速芯片市场规模预计增至2,398.00亿元。在国际地缘政治
加剧的背景下,中国加快了智能算力领域的战略布局,国内智算中心的快速建设推动了AI芯片的需求不断抬
升。IDC数据显示,2024年中国加速计算服务器市场规模达到221亿美元,同比2023年增长134%;到2029年,
中国加速计算服务器市场规模将超过千亿美元。
(2)主要技术门槛
作为现代信息技术发展的物理基石和底层基础设施,GPU具有高价值量、高复杂度、高技术门槛和快速
演进的特征,对企业自主研发、稳定供应和持续创新能力提出了较高要求。芯片设计属于技术密集型行业,
GPU芯片设计更是涉及到硬件架构设计、IP/SoC芯片设计、封装设计、软件架构设计、驱动程序及基础软件
等多个专业领域,技术深度与复杂程度较高,产品技术特性决定了GPU行业具有较高的进入壁垒。掌握GPU核
心设计能力需要长期的经验积淀和充足的工程实践,需要一批深耕行业的高素质技术人员的研发投入和持续
迭代演进,技术储备亦需要较长周期。
近年来,随着大模型算法的快速迭代和模型参数量的指数级增长,GPU硬件设计向更高算力、更大存储
、更高通信带宽、更多元的混合精度等方向不断发展,企业需要时刻掌握行业关键技术的发展动态、保持对
前沿技术的敏感度和快速消化吸收能力才能根据市场及客户的需求及时创新。新进入企业难以在短时间内掌
握相关核心技术,亦难以持续保证技术符合算法不断发展的需求,因此GPU行业具有较高的技术壁垒。
2、公司所处的行业地位分析及其变化情况
(1)技术地位
沐曦股份是国内高性能通用GPU的领导者之一,产品性能达到了国际上同类型高端处理器的水平,在国
内处于领先地位。
在技术积累方面,公司创始团队拥有深厚的GPU技术及全流程量产经验,形成了一支深刻洞察全球GPU行
业技术发展趋势,具有持续自主创新能力的技术研发团队。在团队不懈的技术攻坚下,公司成为了国内少数
几家全面系统掌握了通用GPU架构、GPUIP、高性能GPU芯片及其基础系统软件研发、设计和量产核心技术的
企业之一。公司GPU产品在通用性、单卡性能、集群性能及稳定性、生态兼容与迁移效率等方面具备较强的
核心竞争力,综合技术实力领先行业。通用性方面,公司GPU芯片具备丰富、灵活的指令集和精巧的处理器
架构,可覆盖人工智能与通用计算(包括科学计算)多元化应用场景。以大模型为特征的通用人工智能技术
正处于不断发展演进的过程,大模型的迭代速度持续加快、迭代创新日趋频繁,算子也随之快速变化。因此
,通用、灵活的GPU架构能够高效适应云端快速迭代的复杂算法并保持对传统模型结构的良好支持,从而广
泛支持各种类型的人工智能应用场景。单卡性能方面,公司是国内首批具备高性能GPU芯片设计能力和商业
化落地能力的企业之一,全栈GPU产品基于自主研发和自主知识产权的GPUIP、GPU指令集和架构,单卡性能
处于国内第一梯队;集群性能方面,公司自研的MetaXLink具备国内稀缺的高带宽卡间互连能力,可实现2-1
28卡等多种互连拓扑及超节点架构,并且在智算集群的线性度和稳定性方面具有较强的产品表现;软件生态
方面,公司自主构建的MXMACA软件栈不仅拥有统一、完整且高效的全栈式工具链,涵盖应用开发、功能调试
和性能调优等核心环节,同时高度兼容GPU行业国际主流CUDA生态,能够开放拥抱全球开发者丰富的开源成
果,具有较高的易用性和迁移效率,在通用性和灵活性上具备独特的竞争力。
(2)市场地位
公司是国内少数真正实现千卡集群大规模商业化应用的GPU供应商,并正在研发和推动万卡集群的落地
,目前已成功支持MoE大模型、类脑大模型、强化学习等模型架构创新、全量预训练和推理。公司与整机服
务器、操作系统、运维管理平台、主流AI框架、主流大模型等上下游生态广泛适配,通过芯片层、框架层、
模型层的深度协同优化,为头部大模型训练和分布式推理提供高性能国产算力,助力“国产算力+大模型产
业”实现从技术突破到商业化落地的跨越式发展。凭借突出的产品性能和稳定的供应能力,截至报告期末,
公司GPU产品累计销量超过55,000颗。公司深度构建“1+6+X”生态与商业布局,基础算力底座方面,公司产
品相继应用部署于10余个智算集群,算力网络覆盖国家人工智能公共算力平台、运营商智算平台和商业化智
算中心,区域横跨北京、上海、杭州、长沙、中国香港等地区,并逐渐向更多区域延伸。公司GPU产品深度
赋能众多行业应用场景,已率先布局教科研、金融、交通、能源、医疗健康、大文娱等行业以及“具身智能
”、“低空经济”等前沿方向,产品赋能真实应用场景的竞争力和交付能力得到充分验证。
(3)品牌地位
随着技术不断自主创新和商业化能力日臻完善,公司已成为我国人工智能产业链的重要参与者,积极推
动国家智算领域的自主可控,不断加速GPU芯片国产替代进程,参与了数个国家级和省级重大科研课题并积
累了一系列知识产权和荣誉奖项。截至2025年12月31日,公司拥有境内授权专利360项,其中发明专利350项
。公司被认定为国家级专精特新“小巨人”企业、国家高新技术企业、上海市专精特新中小企业、上海市重
点服务独角兽(潜力)企业等,是中国通信标准化协会、中国信息协会、中国互联网协会、中国半导体行业
协会、中国计算机学会等行业协会的成员单位,积极推动国家算力发展与产业升级。公司荣获“上海市市级
企业技术中心”、“2025胡润中国人工智能企业50强”、“2025年度上海市科技小巨人”、“2024年VENTUR
E50风云企业”、“2024年VENTURE50硬科技企业”、“‘中国芯’2023年年度重大创新突破产品奖”、“国
产GPU飞跃产品”、“胡润2023全球数字经济独角兽”、“2022-2023年度中国半导体市场领军企业”、“20
23年度中国AI芯片企业先锋企业TOP30”、“2022年中国新锐半导体公司最佳雇主Top20”等荣誉奖项,在行
业内具有较高的品牌知名度。
3、报告期内新技术、新产业、新业态、新模式的发展情况和未来发展趋势
(1)从“算力主权”到“算力平权”,ScalingLaw带动GPU行业全面放量
随着人工智能技术持续突破,DeepSeek的推出掀起了新一轮人工智能浪潮,在全球范围内实现了一轮AI
普及,推动全球人工智能竞赛再次加速。一方面,DeepSeek通过优化算法大幅降低了训练和推理成本,并且
采取开源的方式推动行业从“算力主权”向“算力平权”的格局发展,使得中小企业和终端应用群体可以跨
越算力门槛,在开源模型的基础上实现技术普惠,推动人工智能真正进入“全民时代”。虽然短期内GPU芯
片可能因为训练效率的提升而受到影响,但在杰文斯悖论的推动下,大模型的快速迭代和AI应用的增长潜力
将驱动GPU行业长期发展。另一方面,模型和硬件工程上的多种创新技术推动算力需求结构发生根本性变革
,除大模型预训练阶段的算力需求持续增长外,后训练和推理阶段成为了算力需求新的增长动能。算力需求
从“重预训练”到“全流程平衡”的转变,正在重构人工智能产业的价值链,推动算力资源配置向更灵活、
更繁荣的方向演进。
(2)分布式并行计算环境下,多卡互连成为算力竞争的核心要素
随着模型规模、数据量、参数量的快速增长,单一芯片、单台计算设备已经无法满足不断涌现的大规模
数据、多任务应用的需求。通过集群互连弥补单卡性能不足、使用多台设备同时运算的“分布式并行”策略
成为了当前及未来发展的主流选择,基于ScaleUp与ScaleOut的技术应运而生。ScaleUp通过增加单服务器内
部的GPU数量,形成超节点,以满足大规模模型训练的需求;ScaleOut则通过增加服务器数量,构建大规模
分布式计算集群。然而并行计算所产生的集合通信数据规模极大,如何部署、连接和调用这些分布式的计算
网络或设备,以实现给定硬件条件下的最高运算效率,成为制约大模型分布式计算的瓶颈。高速互连技术则
在此环节发挥了关键作用,多卡互连能力、卡间互连带宽直接影响集群有效算力,更优的互连技术方案能更
好支持数据并行、流水线并行和张量并行等策略。因此,在分布式计算环境下,高速互连技术不断升级系大
势所趋。
(3)随着应用市场的繁荣发展,软件生态成为AI芯片易用性的关键底座
对于开发者和使用者而言,AI芯片的易用性是除产品性能外的另一大门槛。软件生态作为人工智能模型
和底层硬件之间的接口,则是影响芯片易用性的核心。GPU硬件设计复杂度较高,人工智能应用的开发和部
署需要借助丰富的软件生态,以实现对底层硬件资源的深度利用。相关软件工具需要与GPU硬件协同优化以
确保GPU的高性能和易用性。此外,在算子高频更新的大模型时代,软件生态能力决定了落地场景的丰富度
。随着人工智能应用逐渐向AIAgent、具身智能延展,与业务紧密结合的人工智能应用场景逐渐落地,完善
的软件生态将与应用市场相辅相成,共同促进人工智能市场的不断繁荣。
(4)云边端融合发展,GPU与ASIC将互为补充、长期共存
算法创新和开源普惠为人工智能应用大规模落地奠定了坚实的基础。当前全球算力重心正处于从预训练
ScalingLaw向后训练ScalingLaw和推理阶段Test-timeScalingLaw的转移过程中,基于强化学习、思维链等
算法创新,在后训练和推理阶段投入更多的算力可以进一步提升大模型的深度思考能力,长期来看为人工智
能应用打开了商业化空间。三大ScalingLaw共同支撑着全球算力需求,驱动人工智能应用在云端、边缘端和
终端融合发展。云边端将结合各自特征承担不同的职能。云端作为资本开支最大、计算能力要求最高的需求
场景,将成为人工智能训练和推理的“智能大脑”,处理重量级人工智能任务;端侧(边缘端、终端)则是
综合平衡性能和负载的选择,作为“小脑”和“四肢”处理即时、轻量级人工智能任务。云端快速迭代的算
法和大量非传统模型结构的出现需要GPU芯片完成高效迁移与适配;而端侧对功耗、负载的敏感度亦新增了
对ASIC芯片的需求,ASIC芯片可针对固定模型结构及特定应用场景提供更具能效比的解决方案,成为GPU芯
片的有效补充。因此长期来看,未来GPU和ASIC将各有侧重、互为补充、长期共存。
二、经营情况讨论与分析
2025年,全球人工智能行业在开源大模型快速普及的推动下,正式迈入规模化落地与技术普惠的新阶段
。同时,受美国高性能GPU/AI芯片出口管制与国内自主可控市场发展等因素影响,国产人工智能芯片公司迎
来黄金发展期,以不同技术路径切入市场,各具特色。报告期内,公司始终专注于GPU产品的技术创新和迭
代升级,凭借独具优势的GPU产品体系和自主开放的软件生态,持续为云端计算提供高能效、高通用性的算
力支撑,推动人工智能赋能千行百业,已成为推动我国智能算力基础设施自主可控的重要力量。
(一)经营业绩大幅增长,亏损持续收窄提质增效
报告期内,公司实现营业收入164,408.55万元,较上年同期增加90,101.39万元,同比增长121.26%,主
要系报告期内随着公司产品及服务获得下游客户的广泛认可与持续采购,公司GPU产品出货量显著增长,带
动收入规模较上年同期实现显著增加;2025年全年,公司利润总额-77,939.27万元,同比亏损收窄62,594.2
6万元,较上年同期亏损收窄44.54%。归属于上市公司股东的净利润-78,944.63万元,同比亏损收窄61,943.
31万元,较上年同期亏损收窄43.97%。报告期内,公司依托持续高强度研发投入形成的全自研GPU芯片及软
硬件生态优势,推动产品在智算中心、运营商、金融、能源等重点场景实现规模化落地,产品性能与场景适
配能力均通过客户严苛验证,市场认可度与行业影响力持续提升。
(二)深耕研发创新,筑牢技术核心壁垒
公司自成立以来,在GPU芯片领域进行持续而高效的研发及创新,5年内完成3颗主力芯片的一次性流片
量产,性能比肩国际标杆产品,自研MXMACA原生态兼容CUDA,与行业生态同步高速迭代。报告期内,公司持
续加大产品研发力度,研发投入102,739.29万元,研发投入占营业收入比例为62.49%。目前,公司拥有675
人的研发团队,占员工总人数的73%,70%以上研发技术人员拥有硕士及以上学历。
公司秉承“量产一代、在研一代、规划一代”的产品研发策略,建立了完善的IPD研发流程,持续在下
游适配与应用中进行技术优化,推动产品迭代升级和产品竞争力不断抬升。2025年7月24日,公司于WAIC大
会上发布首款基于全国产工艺的曦云C600系列,曦云C600不仅在算力上较上一代产品曦云C500有较大提升,
还在精度、HBM上有新技术的应用。曦云C600最重大的意义在于实现了全国产工艺,为复杂地缘政治背景下
的供应链安全及稳定提供了保障。曦云C600于2025年末实现风险量产,并预计于2026年上半年实现量产销售
,未来有望成为公司的下一代主力产品。
(三)完善生态商业布局,推进产品规模化商用落地
围绕“1+6+X”生态与商业布局,公司始终坚持以客户为中心,打造“易用好用、稳定可靠”的产品,
与合作伙伴共赢。公司与整机服务器、操作系统、运维管理平台、主流AI架构、主流大模型等上下游生态广
泛适配,打造了全生态计算平台解决方案。
凭借突出的产品性能和稳定的供应能力,截至报告期末,公司GPU产品累计销量超过55,000颗,产品相
继应用部署于10余个智算集群,算力网络覆盖国家级人工智能大模型训练场、运营商和商业化智算中心,区
域横跨北京、上海、杭州、长沙、中国香港等地区,并逐渐向更多区域延伸。公司GPU产品深度赋能众多行
业应用场景,已率先在医疗、教科研、交通、能源、金融、大文娱等行业实现落地应用,并积极布局“具身
智能”、“低空经济”等前沿方向,产品赋能真实应用场景的竞争力和交付能力得到充分验证。
公司始终坚持推动软件生态开源共享,通过产学研合作不断助力大模型应用在千行百业加速落地。自20
25年2月14日公司开源社区开放以来,截至2026年3月13日,公司MXMACA软件栈注册用户超过30万人,网络AP
I调用次数超过5,591万次,文件下载量超过16万次。
(四)登陆科创板,规范治理护航长远发展
2025年12月17日,公司成功在上海证券交易所科创板挂牌上市。作为国内高性能GPU产品的主要领军企
业之一,公司将严格遵循上市公司监管要求,持续健全内部控制体系与规范运作机制,不断提升治理水平与
信息披露质量,切实维护公司、股东及投资者合法权益,助力国产算力自主可控与长期高质量发展。
三、报告期内核心竞争力分析
(一)核心竞争力分析
在实际人工智能计算场景中,芯片的效率输出由芯片性能、集群性能和软件生态的易用性共同决定。公
司坚持以自主技术创新为导向,持续深耕GPU行业,在专业知识储备深厚、行业经验丰富的研发团队带领下
,公司通过技术创新和设计优化,持续提升GPU架构的通用性、GPU产品的高能效(单卡性能和集群性能)与
GPU软件生态的易用性,率先实现了“技术-产品-市场”的产业化应用。具体竞争优势如下:
1、技术优势:技术积累深厚全面,核心技术自主可控
GPU芯片设计复杂,其核心技术此前仅掌握在几家国际领先企业手中。公司是国内少数几家全面系统掌
握了GPU架构、GPUIP、先进制程GPU芯片及其基础系统软件研发、设计和量产等全流程核心技术的企业之一
,拥有自主研发的GPUIP、GPU指令集和架构等,充分掌握并构建了一整套完善且自主可控的底层核心技术体
系。公司在长期自主研发和产业化过程中积淀了丰厚的核心技术,建立了完善的研发体系,形成了一系列具
有自主知识产权的核心技术成果。截至2025年12月31日,公司拥有境内发明专利350项、集成电路布图设计
专有权4项、软件著作权41项,并多次与政府合作科研项目,技术储备位居国内GPU行业第一梯队。
2、通用性优势:以GPU架构和GPUIP打造全系列GPU产品,具备通用性、灵活性和自主性
公司全系列产品采用统一的GPU计算架构,兼具通用性和高性能。由于以大模型为特征的通用人工智能
技术不断演进,例如算法和模型持续迭代、数据的规模和质量持续升级,其所要求的建模仿真的精度和计算
效率大幅提升,导致人工智能产业计算复杂度持续提升。同时,目前绝大部分大模型厂商的算法创新均基于
GPU实现,而公司通用、灵活的GPU架构能够高效适应云端快速迭代的复杂算法和大量非传统模型结构,从而
支持更为广泛的人工智能应用场景。
GPUIP与指令集方面,公司是国内少数坚持自主研发核心GPUIP的集成电路设计企业,经过多年产品设计
及落地经验的积累,已形成了全面覆盖计算(人工智能训练、推理、通用计算)和渲染场景的核心GPUIP,
打造了由超过600条(XCORE1.0计算GPU)、800条(XCORE2.0渲染GPU)指令组成自主安全可控的MXMACA指令
集。自研核心GPUIP具有灵活性和自主性优势,能够通过GPUIP的设计优化摆脱对最先进工艺的依赖、弥补工
艺代差带来的性能损失。公司自主研发的核心GPUIP不仅满足了当前复杂多样的计算需求,还为未来的技术
创新和产品迭代奠定了坚实的基础。
3、高能效优势:GPU硬件设计在多个维度突破国外垄断
根据多家行业权威的国家实验室、计算中心、研究所的测试结果,公司GPU产品在单卡性能、集群性能
及稳定性等多维度方面具有领先的产品表现力,具体体现如下:
公司训推一体GPU具备国内领先的计算能力,拥有丰富的标量、矢量和张量计算单元,全面支持各种主
流精度的计算加速,能够满足人工智能训练和推理、通用计算、科学计算等多元化的算力需求,大幅提升了
智算集群的多场景融合应用能力。同时,公司是全球少数几家掌握了复杂多级缓存结构的GPU企业,凭借独
特的缓存组网技术,能够针对不同场景灵活自适应多级缓存控制策略,实现对高速缓存的精细管控、有效提
升缓存命中率,满足GPU高算力下对于高带宽的需求。
公司具备国内稀缺的高带宽、超多卡互连能力,在集群性能、灵活性和可扩展性方面均处于行业领先地
位。随着大模型参数规模指数级增长,单卡有效算力难以应对超大规模的算力需求,高带宽、低延迟的卡间
互连技术成为关键竞争要素。公司自主研发的MetaXLink高速互连技术突破了传统PCIe总线在带宽和延迟方
面的限制,达到了与国际主流旗舰产品相当的互连带宽性能。同时,公司的GPU产品可实现2-128卡等多种互
连拓扑及超节点架构,满足从中小型训练到超大规模集群的差异化需求,为构建高密度算力和大规模集群、
处理更为复杂的人工智能任务提供了关键技术支撑。
当前人工智能训练任务呈现超线性、高故障率特征和异构混训趋势。公司在算力、互连通信、软件生态
等方面实现了有效均衡,GPU产品在实际智算集群运营中发挥了强大的性能,能够稳定、无中断
|