海天瑞声(688787)价值分析报告投资评级明细|查股网

研报评级☆ ◇688787 海天瑞声 更新日期：2026-08-01◇ 通达信沪深京F10
★本栏包括【1.投资评级统计】【2.盈利预测统计】【3.盈利预测明细】【4.研报摘要】
          【5.机构调研】

【1.投资评级统计】最新评级日期:2026-05-13
时间段   买入评级次数   增持评级次数   中性评级次数   减持评级次数   卖出评级次数   评级次数合计
────────────────────────────────────────────────
3月内               1              1              0              0              0              2
6月内               2              1              0              0              0              3
1年内               2              1              0              0              0              3
────────────────────────────────────────────────

【2.盈利预测统计】(近6个月)
┌──────────┬─────┬─────┬─────┬─────┬─────┬─────┐
│财务指标            │    2023年│    2024年│    2025年│2026年预测│2027年预测│2028年预测│
├──────────┼─────┼─────┼─────┼─────┼─────┼─────┤
│每股收益(元)        │     -0.50│      0.19│      0.23│      0.69│      1.07│      1.65│
│每股净资产(元)      │     12.97│     12.32│     12.30│     12.77│     13.49│     14.60│
│净资产收益率%       │     -3.88│      1.53│      1.90│      5.38│      8.01│     11.33│
│归母净利润(百万元)  │    -30.39│     11.34│     14.12│     41.37│     64.58│     99.42│
│营业收入(百万元)    │    170.01│    237.08│    376.97│    541.68│    745.14│    999.83│
│营业利润(百万元)    │    -42.78│     10.63│     15.12│     45.00│     70.00│    106.33│
└──────────┴─────┴─────┴─────┴─────┴─────┴─────┘

【3.盈利预测明细】(近6个月)
日期           评级       评级变化       目标价    2026EPS    2027EPS    2028EPS       研究机构
────────────────────────────────────────────────
2026-05-13     买入       首次           188.29       0.62       1.00       1.53       国泰海通
2026-05-08     增持       维持              ---       0.51       0.75       1.15       华创证券
2026-04-24     买入       维持              ---       0.93       1.47       2.26       东吴证券
────────────────────────────────────────────────

【4.研报摘要】(近6个月)
──────┬──────────────────────────────────┬──────┬────
  2026-05-13│海天瑞声(688787)首次覆盖报告：AI数据智能工厂，数据训练稀缺龙头      │国泰海通    │买入    
──────┴──────────────────────────────────┴──────┴────
    本报告导读：公司致力于研发和生产高质量、大规模、结构化的训练数据，为算法模型的训练拓展提供可靠素材，是
AI时代的数据生产智能工厂。                                                                                
    投资要点：首次覆盖，给予“增持”评级。我们预测公司2026-2028年归母净利润分别为0.37/0.60/0.92亿元，对应E
PS分别为0.62、1.00、1.53元。我们结合PE和PS的方法对公司进行估值，最终给予公司目标市值114亿元，对应目标价为1
88.39元，首次覆盖，给予“增持”评级。                                                                     
    数据训练龙头，AI数据生产的智能工厂。公司成立于2005年，致力于研发和生产高质量、大规模、结构化的训练数据
，为算法模型的训练拓展提供可靠训练素材，助力AI商业化落地。公司生产的模型训练数据涵盖智能语音、计算机视觉及
自然语言处理三大核心领域，交付形式包括标准化产品和定制化服务，公司还外延提供与训练数据相关的应用服务。截止
2025年底，公司累计客户数量超过1200家，覆盖科技互联网、社交、IoT、具身智能、智能驾驶、大模型等领域的主流企 
业，以及政企、教育科研机构。                                                                              
    高质量训练数据是AI规模化应用的核心“燃料”。作为大模型学习、训练和验证的“燃料”基础，大规模、高质量的
数据集对于模型能力的提升愈加重要，当前高质量数据短缺已成为AI规模化落地的关键制约。2025年6月，Meta以148亿美
元收购数据标注初创公司ScaleAI49%股权，充分凸显AI时代数据的价值。根据Cognilytica统计数据，预计2027年全球AI 
训练数据市场规模将达到220亿美元，2021-2027年复合增长率达32%。                                             
    下游需求爆发，公司业绩增长步入快车道。2025年公司实现营收3.77亿元，同比+59.00%；归母利润0.14亿元，同比+
24.54%；收入和利润均实现快速增长，延续2024年趋势。伴随多模态模型技术突破和AI应用场景落地加速，AI训练数据需
求爆发，公司凭借丰富的数据集积累和服务经验，持续获得海内外头部科技企业订单，业绩已步入快速增长通道。      
    风险提示：AI技术迭代风险，AI应用落地不及预期，行业竞争加剧风险。                                      

──────┬──────────────────────────────────┬──────┬────
  2026-05-08│海天瑞声(688787)2025年报及2026年一季报点评：具身智能前瞻卡位，数据要│华创证券    │增持    
            │素价值释放                                                          │            │        
──────┴──────────────────────────────────┴──────┴────
    事项：                                                                                                
    公司发布2025年报及2026年一季报，2025年实现营业收入3.77亿元，同比+59.00%；实现归母净利润0.14亿元，同比+
24.54%。2026Q1实现营业收入9,677.93万元，同比+38.63%；实现归母净利润840.30万元，同比+2,161.14%。           
    评论：                                                                                                
    业绩高速增长，业务结构向多模态和定制化加速转型。2025年公司业绩实现高速增长，主要受益于全球人工智能产业
迈向“规模化落地”，训练数据业务迎来强劲增长。分业务看，计算机视觉业务实现收入1.48亿元，同比+217.66%；自然
语言业务实现收入0.51亿元，同比+112.29%，成为增长核心引擎，训练数据相关的应用服务业务实现收入0.28亿元，同比
+1390.69%，表现亮眼；传统优势的智能语音业务收入实现收入为1.50亿元，同比-8.66%。公司业务结构正发生深刻变化 
，毛利较低的定制服务收入占比持续抬升，反映了头部客户为打造模型差异化而寻求独特数据的行业趋势，受此影响，公
司整体毛利率下降18.38pct至48.08%。                                                                        
    境内外业务齐头并进，数据要素打开G端新空间。公司全球化战略成效初显，2025年境外业务实现收入1.58亿元，同 
比+38.68%，其中东南亚数据交付基地已进入稳定运营阶段，为海外定制化服务市场贡献了显著增量。境内业务实现收入2
.19亿元，同比+77.72%，增长动能强劲。公司凭借丰富的数据服务经验以及海量标品数据集积累，持续获得国内外头部科
技企业的数据需求订单。公司紧抓“数据要素X”战略机遇，地方政府积极布局结合各地产业特色的人工智能应用，公司 
为相关项目交付垂直领域AI模型及应用平台，并助力地方政府建设针对地方产业特色的高质量数据集，推动数据资源向资
产化、价值化转化，已与成都、长沙、保定等城市合作共建数据标注基地，2026Q1公司新签订单及确认合作待签署订单同
比增长超100%，在手订单充足、结构优质，为全年持续良性增长奠定坚实基础。                                    
    前瞻布局具身智能，构筑第二成长曲线。公司精准把握具身智能作为AGI关键路径的发展趋势，将数据视为其核心瓶 
颈，进行前瞻性战略布局。公司已组建具身智能数据专项团队，并开始在全国多个城市启动项目落地，与国内头部机器人
本体厂商展开合作，推动人形机器人在千行百业的规模化应用。2026年，公司将加快具身智能数据训练场方案落地与数据
资源储备，持续深化与头部机器人本体厂商、科技大厂、相关地方政府的合作，为具身智能产业的发展提供坚实的数据支
撑。                                                                                                      
    投资建议：考虑到公司在数据要素和具身智能等新兴领域布局领先，商业化落地进程超预期，同时受益于头部大厂AI
投入及地方政府数据要素投入加大。我们预计2026-2028年公司营收分别为5.49/7.62/10.55亿元，对应增速分别为45.6%/
38.9%/38.4%；归母净利润分别为0.31/0/.45/0.70亿元，对应增速分别为117.5%/48.1%/53.1%，对应EPS为0.51/0.75/1.1
5元，维持“推荐”评级。                                                                                   
    风险提示：AI技术发展不及预期；数据要素政策落地不及预期。                                              

──────┬──────────────────────────────────┬──────┬────
  2026-04-24│海天瑞声(688787)2025年报&2026一季报点评：业绩持续高增               │东吴证券    │买入    
──────┴──────────────────────────────────┴──────┴────
    事件：公司发布2025年报&2026一季报，公司2025年营收3.77亿元，同比增长59%；归母净利润0.14亿元，同比增长25
%。2026年Q1营收0.97亿元，同比增长39%；归母净利润0.08亿元，同比增长2161%，符合市场预期。                   
    投资要点                                                                                              
    收入持续高增：分业务来看，公司2025年计算机视觉业务收入1.48亿元，同比+218%；自然语言业务收入0.51亿元， 
同比+112%；智能语音业务收入1.50亿元，同比-9%；训练数据相关应用服务收入0.28亿元，同比+1394%。2026Q1公司营收
持续高增，主要系1）国内外头部大厂加大视频、文本等方面AI数据投入；2）地方数据标注基地项目建设加快推进；3） 
东南亚数据交付基地完成产能爬坡。公司2025年毛利率48%，同比下滑，主要受定制化服务业务收入占比提升影响。2026Q
1公司相对高毛利的训练数据应用服务收入占比提升，整体毛利率改善至56%。                                      
    模型迭代加速推动需求快速提升：随着AIAgent、文生视频、AI编程等场景开始大规模应用，大模型以及垂类场景应 
用迭代速度不断加快，推动客户采购高质量专业数据的需求量和复杂度提升。公司多年服务阿里巴巴、字节跳动、腾讯、
中国移动等头部客户，已成为多家行业领先企业的核心数据服务供应商，率先受益。除大厂外，公司积极拓展政府和央国
企客户，已为广西、四川等地打造多类特色数据集，并同步推进湖南、内蒙古等地的专项数据集建设。2026年3月，世界 
数据组织成立，海天瑞声以发起单位身份深度融入。我们预计未来公司将继续推进和地方政府共建高质量数据集，推动数
据标注平台和应用落地。                                                                                    
    全球化布局持续优化：公司进一步强化北美、欧洲及日韩销售团队，深化本地化服务能力，公司在东南亚新建的数据
交付基地已进入稳定运营阶段，为海外业务贡献了显著的增量收入，未来将成为支撑公司全球化战略的重要支点。      
    拓展具身智能等新场景：具身智能需要机器人在复杂的真实世界中实现自主感知、学习和适应，该能力的构建依赖海
量来自“真实物理环境”的动态交互数据进行训练。目前相关数据获取成本高、覆盖场景有限，供需缺口非常大。公司已
与国内某头部具身厂商签署真机数据采集合约，并与多家头部具身厂商、科技大厂及地方政府启动订单对接，有望成为公
司新的增长点。                                                                                            
    盈利预测与投资评级：高质量数据集是人工智能发展的基础，公司是A股稀缺的专注提供AI训练数据解决方案的领军 
企业，2026Q1新签订单及确认合作待签署订单同比增长超100%，业绩有望持续高增，我们将公司2026-2027年EPS由0.92/1
.50元调整至0.93/1.47元，预计2028年EPS为2.26元，维持“买入”评级。                                         
    风险提示：行业竞争加剧，项目回款不及预期，研发进展不及预期。                                          

【5.机构调研】(近6个月)
参与调研机构：33家
──────┬──────────────────────────────────────────────
  2026-06-08│海天瑞声(688787)2026年6月8日投资者关系活动主要内容                                          
──────┴──────────────────────────────────────────────
    1、一季度公司毛利率提升的原因是什么？                                                                 
    答：2026年第一季度公司毛利率同比提升，主要得益于业务结构的积极变化，具体来说：高毛利的政府平台类业务在
本季度显著起量。政府（G端）客户的可信数据空间建设，核心是提供标准化程度较高的数据处理平台及方案，相比传统 
定制化的数据采集与标注业务，其人力密集程度更低、交付周期更短、边际成本递减效应更明显，因此毛利率水平更高。
    2026年第一季度，随着公司前期在G端市场的全面布局进入收获期，这部分高毛利业务在收入结构中的占比明显提升 
，从而带动了整体毛利率的增长。                                                                            
    2、后训练和强化学习阶段，对数据标注需求有哪些变化？                                                   
    答：在后训练和强化学习（RLHF/GRPO）阶段，模型的目标从“预训练期学会语言统计规律”转向“对齐人类偏好， 
这对标注数据的需求产生了深刻变化。                                                                        
    （1）从“量”到“质”与“复杂度”的转变                                                               
    后训练阶段不再需要海量的原始文本，转而需要高质量、细粒度、领域专家级的标注数据。例如，SFT（监督微调） 
依赖精确的“标准答案”，而RL训练则需要能区分“好/较好/差”的偏好排序数据。                                
    （2）聚焦“难例”与“长尾”场景                                                                       
    在RL阶段，“难例”（模型初始成功率低的数据）的价值远超易例，且能极大增强模型的泛化能力。标注重点从普遍
规律转向稀缺、复杂的边界案例。                                                                            
    3、公司在具身数据领域的核心竞争优势是什么？                                                           
    答：（1）硬件理解+驾驭壁垒：通过头部主流本体厂商合作经验，深度理解本体硬件性能特性、负载逻辑与异构适配
要点，可快速解决硬件高故障率与稳定性问题；已在北京运营首个具身智能数据训练场，依托100+台机器人实现高效数据
产出。                                                                                                    
    （2）模型理解与落地壁垒：核心团队拥有大模型开发等资深背景，懂模型更懂数据；数据体系精准对齐机器人大脑 
训练范式，提供具备高泛化能力的数据解决方案，支撑具身大脑模型训练。                                        
    （3）综合数据工程化壁垒：不仅具备全球化数据采集与低成本交付资源；同时，自研的AI自动化标注平台与7×24小
时算法质检，兼顾低成本与专家级质量。                                                                      
    4、不同机器人公司之间，是否存在可以共用的数据？                                                       
    答：不同机器人公司之间确实存在可以共用的数据，但需要区分数据类型来看。                                
    目前数据主要分为三类：真机数据、UMI数据、第一人称视角数据。                                           
    从共用难度来看，真机数据很难直接共用，而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视
角数据不绑定具体机器人的关节参数和运动学模型，采集的是“操作过程”本身，理论上可以被不同机器人学习和泛化。
    为什么真机数据很难共用？主要有2个原因：                                                               
    一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同，A公司的“抓取”数据没法直接拿 
去训练B公司的机械臂。                                                                                     
    二是数据格式各自为政，行业缺乏统一的标准和“通用语言”。                                              
    所以行业正在推动的是：让UMI和第一人称这类“本体无关”的数据更多流通共用，同时通过技术对齐和标准统一， 
逐步解决真机数据的跨本体迁移问题。                                                                        
    5、具身智能数据服务的需求逻辑？                                                                       
    答：具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌，而是类似大模型‘涌现
’的范式变革。由于当前仿真环境无法完美模拟物理接触与长尾场景，海量、高泛化度的真实物理交互数据成为训练具身
大脑的唯一‘燃料’，这是具身智能区别于传统自动化的根本逻辑。                                              
    6、具身客户为何不自己做数据，而选择外部采购？                                                         
    答：数据工程是一项重人力、重流程、重管理的‘苦活累活’，并非算法厂商的核心基因。自建数据团队不仅边际成
本高，且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”，通过规模化、标准化、可伴随客户
迭代而同步迭代的整体数据供应链能力，帮助客户剥离非核心业务，使其聚焦于算法与本体研发，实现产业分工的最优解
。                                                                                                        
    7、具身智能数据赛道能做多久，是否像智驾一样只有短期机会？                                             
    答：这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言，自动驾驶主要解决避障与导航，而具身智能需要
解决非结构化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义，数据需求将伴随机器人进家庭、进工厂的全过
程。我们定位为全行业的数据基础设施，旨在伴随行业全生命周期成长，而非短期套利                              
─────────────────────────────────────────────────────

参与调研机构：15家
──────┬──────────────────────────────────────────────
  2026-06-05│海天瑞声(688787)2026年6月5日投资者关系活动主要内容                                          
──────┴──────────────────────────────────────────────
    1、WDO成立之后，您认为会对整个AI数据行业的格局、合规与商业化带来哪些影响？                            
    答：尊敬的投资者：您好，WDO（世界数据组织）于2026年3月在北京成立，是全球首个专注于数据治理的非政府、非
营利性国际组织，已汇集40多国200余家会员单位。其对数据行业的影响主要体现在以下几个方面： （1）填补全球治理 
空白 此前全球缺乏专门协调数据政策的专业机构，各国规则割裂。WDO搭建统一对话平台，推动从单一“规则”导向转向
“规则+标准”并重，引入“集体数据治理”新范式。 （2）降低跨境合规成本 各国数据政策差异导致企业跨国运营合规
成本高昂。WDO推动行业共识与标准互认，有望实现“一次评估、多国互认”，降低企业数据合作成本，提升政策可预期 
性。 （3）促进数据有序流动 WDO为数据跨境流动提供制度供给，打通堵点，带动数字贸易与科技创新。 （4）赋能全球
南方国家 WDO将发展中国家数据能力建设作为重点，通过技术援助缩小数字鸿沟。数据无价值差的特性使南方国家在数字
贸易中可与发达国家站在同一起跑线，放大其在存储、算力、人力成本等方面的优势。 （5）加速国内数据要素国际化  
国内33家数据交易所活跃度预期将获提升，首批跨国数据产品挂牌可期。标准互认倒逼合规体系建设，具备跨境合规能力
的企业优先受益，中国数据治理经验可向国际输出。 （6）推动产业生态落地 聚焦医疗、教育等场景推动项目落地，提 
炼可复制解决方案，促进全球数字产业协同。                                                                  
    2、公司参与WDO的初衷是什么？在其中承担怎样的角色与定位？                                              
    答：尊敬的投资者：您好，海天瑞声作为仅有的少数几家企业发起单位之一参与其中，并荣膺首届理事单位，也是AI
数据领域唯一入选的企业。WDO选中海天瑞声，是基于公司深耕AI训练数据领域超过20年的积累——公司已形成覆盖数据 
采集、处理、标注、治理到应用落地的全链条能力体系，拥有覆盖全球300多个语种的多模态数据资源，累计服务全球上 
千家科技企业与科研机构。公司的定位是借助WDO平台深度参与全球数据治理体系建设：一是推动数据质量、生产流程等 
标准的国际互认，输出工程化、规模化数据治理经验；二是依托对WDO规则和框架的深度理解，在现有出海基础上进一步 
提升全球化业务拓展效率；三是作为理事单位，持续发挥产业实践优势，推动数据标准共建与生态协同。              
    3、为什么机器人厂商倾向于外购数据服务而不是自建团队？                                                 
    答：尊敬的投资者：您好，数据工程是一项重人力、重流程、重管理的‘苦活累活’，并非算法厂商的核心基因。自
建数据团队不仅边际成本高，且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”，通过规模化
、标准化、可伴随客户迭代而同步迭代的整体数据供应链能力，帮助客户剥离非核心业务，使其聚焦于算法与本体研发，
实现产业分工的最优解。                                                                                    
    4、大模型进入后训练与强化学习阶段后，对数据标注的需求发生了哪些关键变化？                             
    答：尊敬的投资者，您好：在后训练和强化学习（RLHF/GRPO）阶段，模型的目标从“预训练期学会语言统计规律” 
转向“对齐人类偏好，这对标注数据的需求产生了深刻变化。 （1）从“量”到“质”与“复杂度”的转变 后训练阶段 
不再需要海量的原始文本，转而需要高质量、细粒度、领域专家级的标注数据。例如，SFT（监督微调）依赖精确的“标 
准答案”，而RL训练则需要能区分“好/较好/差”的偏好排序数据。 （2）聚焦“难例”与“长尾”场景 在RL阶段，“ 
难例”（模型初始成功率低的数据）的价值远超易例，且能极大增强模型的泛化能力。标注重点从普遍规律转向稀缺、复
杂的边界案例。                                                                                            
    5、管理层如何看待当前具身智能赛道的发展阶段与未来空间？                                               
    答：尊敬的投资者：您好，公司高度看好具身智能数据这一新兴赛道，已将其作为战略重点进行前瞻布局，并组建了
专项团队加快业务落地。 从行业前景看，具身智能已被国家列为未来产业重点培育方向。当前，机器人“大脑”认知决 
策等核心能力仍处于发展早期，大模型泛化能力尚未成熟，规模化落地亟需海量高质量、细颗粒度的训练数据支撑，市场
空间广阔。 从市场需求看，国内外头部科技企业与本体厂商已启动规模化数据采购，需求覆盖真实场景交互数据、第一 
人称视角数据、UMI数据、仿真数据等。与此同时，部分地方政府正积极规划“具身智能训练场”，以工程化方式生产高 
质量数据，赋能产业应用。 目前，公司已与国内某头部具身厂商签署真机数据采集合约，并与多家头部具身厂商、科技 
大厂及地方政府启动订单对接，正稳步推进样例数据方案的设计与落地，为具身智能数据业务的规模化发展蓄力筑基。  
    6、不同机器人厂商之间，是否存在可通用、可复用的数据？                                                 
    答：尊敬的投资的者：您好，不同机器人公司之间确实存在可以共用的数据，但需要区分数据类型来看。          
    目前数据主要分为三类：真机数据、UMI数据、第一人称视角数据。                                           
    从共用难度来看，真机数据很难直接共用，而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视
角数据不绑定具体机器人的关节参数和运动学模型，采集的是“操作过程”本身，理论上可以被不同机器人学习和泛化。
    为什么真机数据很难共用？主要有2个原因：                                                               
    一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同，A公司的“抓取”数据没法直接拿 
去训练B公司的机械臂。                                                                                     
    二是数据格式各自为政，行业缺乏统一的标准和“通用语言”。                                              
    所以行业正在推动的是：让UMI和第一人称这类“本体无关”的数据更多流通共用，同时通过技术对齐和标准统一， 
逐步解决真机数据的跨本体迁移问题。                                                                        
    7、公司2026年第一季度实现较快收入增长，能否详细拆解一下核心驱动因素？                                 
    答：尊敬的投资者：您好，2026年第一季度，公司实现营业收入9,677.93万元，同比增长38.63%，受益于AI应用爆发
与数据要素产业化提速，业绩增长强劲。                                                                      
    全球AI竞争加剧，高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业，传统业务凭借全品类、规模化
、高合规优势稳健增长。同时，ToG可信数据空间业务实现突破，与国家级数据标注试点城市深度合作，提供全栈解决方 
案，开辟政务与公共数据新增长曲线。此外，公司东南亚数据交付基地完成产能爬坡，全球化交付能力与竞争力提升。以
上因素共同驱动公司业务的高速增长。                                                                        
    8、一季度公司毛利率同比有所提升，主要是什么原因带来的？                                               
    答：尊敬的投资者：您好，2026年第一季度公司毛利率同比提升，主要得益于业务结构的积极变化，具体来说：高毛
利的政府平台类业务在本季度显著起量。政府（G端）客户的可信数据空间建设，核心是提供标准化程度较高的数据处理 
平台及方案，相比传统定制化的数据采集与标注业务，其人力密集程度更低、交付周期更短、边际成本递减效应更明显，
因此毛利率水平更高。 2026年第一季度，随着公司前期在G端市场的全面布局进入收获期，这部分高毛利业务在收入结构
中的占比明显提升，从而带动了整体毛利率的增长。                                                            
    9、请问李总，在具身智能数据这个赛道上，公司相比同行最核心的竞争壁垒体现在哪些方面？                   
    答：尊敬的投资者，您好，公司的核心壁垒体现在： （1）硬件理解+驾驭壁垒：通过头部主流本体厂商合作经验， 
深度理解本体硬件性能特性、负载逻辑与异构适配要点，可快速解决硬件高故障率与稳定性问题；已在北京运营首个具身
智能数据训练场，依托100+台机器人实现高效数据产出。 （2）模型理解与落地壁垒：核心团队拥有大模型开发等资深背
景，懂模型更懂数据；数据体系精准对齐机器人大脑训练范式，提供具备高泛化能力的数据解决方案，支撑具身大脑模型
训练。 （3）综合数据工程化壁垒：不仅具备全球化数据采集与低成本交付资源；同时，自研的AI自动化标注平台与7×2
4小时算法质检，兼顾低成本与专家级质量。                                                                   
    10、具身智能数据服务的需求逻辑？                                                                      
    答：具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌，而是类似大模型‘涌现
’的范式变革。由于当前仿真环境无法完美模拟物理接触与长尾场景，海量、高泛化度的真实物理交互数据成为训练具身
大脑的唯一‘燃料’，这是具身智能区别于传统自动化的根本逻辑。                                              
    11、具身智能数据赛道能做多久，是否像智驾一样只有短期机会？                                            
    答：这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言，自动驾驶主要解决避障与导航，而具身智能需要
解决非结构化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义，数据需求将伴随机器人进家庭、进工厂的全过
程。我们定位为全行业的数据基础设施，旨在伴随行业全生命周期成长，而非短期套利。                            
─────────────────────────────────────────────────────

参与调研机构：96家
──────┬──────────────────────────────────────────────
  2026-05-14│海天瑞声(688787)2026年5月14日投资者关系活动主要内容                                         
──────┴──────────────────────────────────────────────
    1、公司第一季度收入增长原因是什么？                                                                   
   答：2026年第一季度，公司实现营业收入9,677.93万元，同比增长38.63%，受益于AI应用爆发与数据要素产业化提速 
，业绩增长强劲。                                                                                          
    全球AI竞争加剧，高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业，传统业务凭借全品类、规模化
、高合规优势稳健增长。同时，ToG可信数据空间业务实现突破，与国家级数据标注试点城市深度合作，提供全栈解决方 
案，开辟政务与公共数据新增长曲线。此外，公司东南亚数据交付基地完成产能爬坡，全球化交付能力与竞争力提升。以
上因素共同驱动公司业务的高速增长。                                                                        
    2、一季度公司毛利率提升的原因是什么？                                                                 
    答：2026年第一季度公司毛利率同比提升，主要得益于业务结构的积极变化，具体来说：高毛利的政府平台类业务在
本季度显著起量。政府（G端）客户的可信数据空间建设，核心是提供标准化程度较高的数据处理平台及方案，相比传统 
定制化的数据采集与标注业务，其人力密集程度更低、交付周期更短、边际成本递减效应更明显，因此毛利率水平更高。
    2026年第一季度，随着公司前期在G端市场的全面布局进入收获期，这部分高毛利业务在收入结构中的占比明显提升 
，从而带动了整体毛利率的增长。                                                                            
    3、公司在具身数据领域的核心竞争优势是什么？                                                           
    答：（1）硬件理解+驾驭壁垒：通过头部主流本体厂商合作经验，深度理解本体硬件性能特性、负载逻辑与异构适配
要点，可快速解决硬件高故障率与稳定性问题；已在北京运营首个具身智能数据训练场，依托100+台机器人实现高效数据
产出。                                                                                                    
    （2）模型理解与落地壁垒：核心团队拥有大模型开发等资深背景，懂模型更懂数据；数据体系精准对齐机器人大脑 
训练范式，提供具备高泛化能力的数据解决方案，支撑具身大脑模型训练。                                        
    （3）综合数据工程化壁垒：不仅具备全球化数据采集与低成本交付资源；同时，自研的AI自动化标注平台与7×24小
时算法质检，兼顾低成本与专家级质量。                                                                      
    4、不同机器人公司之间，是否存在可以共用的数据？                                                       
    答：不同机器人公司之间确实存在可以共用的数据，但需要区分数据类型来看。                                
    目前数据主要分为三类：真机数据、UMI数据、第一人称视角数据。                                           
    从共用难度来看，真机数据很难直接共用，而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视
角数据不绑定具体机器人的关节参数和运动学模型，采集的是“操作过程”本身，理论上可以被不同机器人学习和泛化。
    为什么真机数据很难共用？主要有2个原因：                                                               
    一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同，A公司的“抓取”数据没法直接拿 
去训练B公司的机械臂。                                                                                     
    二是数据格式各自为政，行业缺乏统一的标准和“通用语言”。                                              
    所以行业正在推动的是：让UMI和第一人称这类“本体无关”的数据更多流通共用，同时通过技术对齐和标准统一， 
逐步解决真机数据的跨本体迁移问题。                                                                        
    5、后训练和强化学习阶段，对数据标注需求有哪些变化？                                                   
    答：在后训练和强化学习（RLHF/GRPO）阶段，模型的目标从“预训练期学会语言统计规律”转向“对齐人类偏好， 
这对标注数据的需求产生了深刻变化。                                                                        
    （1）从“量”到“质”与“复杂度”的转变                                                               
    后训练阶段不再需要海量的原始文本，转而需要高质量、细粒度、领域专家级的标注数据。例如，SFT（监督微调） 
依赖精确的“标准答案”，而RL训练则需要能区分“好/较好/差”的偏好排序数据。                                
    （2）聚焦“难例”与“长尾”场景                                                                       
    在RL阶段，“难例”（模型初始成功率低的数据）的价值远超易例，且能极大增强模型的泛化能力。标注重点从普遍
规律转向稀缺、复杂的边界案例。                                                                            
    6、客户为何不自己做数据，而选择外部采购？                                                             
    答：数据工程是一项重人力、重流程、重管理的‘苦活累活’，并非算法厂商的核心基因。自建数据团队不仅边际成
本高，且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”，通过规模化、标准化、可伴随客户
迭代而同步迭代的整体数据供应链能力，帮助客户剥离非核心业务，使其聚焦于算法与本体研发，实现产业分工的最优解
。                                                                                                        
    7、具身智能数据赛道能做多久，是否像智驾一样只有短期机会？                                             
    答：这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言，自动驾驶主要解决避障与导航，而具身智能需要
解决非结构化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义，数据需求将伴随机器人进家庭、进工厂的全过
程。我们定位为全行业的数据基础设施，旨在伴随行业全生命周期成长，而非短期套利。                            
    8、语音业务的发展趋势？                                                                               
    答：语音业务作为公司的传统优势板块，当前正沿着三个明确方向升级：拟人化、全球化、多场景。这三大趋势共同
驱动语音数据业务从“量的扩张”转向“质的升级”。                                                          
    第一，拟人化：多情感、多音色成为刚需。                                                                
    AI交互正从“能听会说”向“拟人化、情感化”迈进。大模型不仅要能识别指令，还要能通过语气、情感、风格进行
自然交互。这要求语音数据覆盖丰富的情感维度和音色特征。公司在此方向已积累大量标准化产品资源，可高效匹配大厂
的多情感、多风格语音交互需求。                                                                            
    第二，全球化：多语种能力决定产品边界。                                                                
    科技巨头正在加速全球化布局，大模型的多语种覆盖能力直接决定了其产品的市场边界。公司拥有覆盖全球300多种 
语言的工业化数据生产网络，以及境外标注基地，能够支持客户AI产品的全球化拓展。                              
    第三，多场景：从通用场景向垂类场景纵深。                                                              
    语音数据的应用正从最初的通用对话，向医疗、金融、教育、车载等垂直行业深度渗透。垂类场景对数据专业性、术
语准确性、场景真实性的要求远高于通用场景，数据价值密度更高，也为公司带来了更高附加值的业务机会。          
    9、具身智能数据服务的需求逻辑？                                                                       
    答：具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌，而是类似大模型‘涌现
’的范式变革。由于当前仿真环境无法完美模拟物理接触与长尾场景，海量、高泛化度的真实物理交互数据成为训练具身
大脑的唯一‘燃料’，这是具身智能区别于传统自动化的根本逻辑。                                              
─────────────────────────────────────────────────────

参与调研机构：72家
──────┬──────────────────────────────────────────────
  2026-05-13│海天瑞声(688787)2026年5月13日、14日、20日投资者关系活动主要内容                             
──────┴──────────────────────────────────────────────
    1、公司第一季度收入增长原因是什么？                                                                   
    答：2026年第一季度，公司实现营业收入9,677.93万元，同比增长38.63%，受益于AI应用爆发与数据要素产业化提速
，业绩增长强劲。                                                                                          
    全球AI竞争加剧，高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业，传统业务凭借全品类、规模化
、高合规优势稳健增长。同时，ToG可信数据空间业务实现突破，与国家级数据标注试点城市深度合作，提供全栈解决方 
案，开辟政务与公共数据新增长曲线。此外，公司东南亚数据交付基地完成产能爬坡，全球化交付能力与竞争力提升。以
上因素共同驱动公司业务的高速增长。                                                                        
    2、一季度公司毛利率提升的原因是什么？                                                                 
    答：2026年第一季度公司毛利率同比提升，主要得益于业务结构的积极变化，具体来说：高毛利的政府平台类业务在
本季度显著起量。政府（G端）客户的可信数据空间建设，核心是提供标准化程度较高的数据处理平台及方案，相比传统 
定制化的数据采集与标注业务，其人力密集程度更低、交付周期更短、边际成本递减效应更明显，因此毛利率水平更高。
    2026年第一季度，随着公司前期在G端市场的全面布局进入收获期，这部分高毛利业务在收入结构中的占比明显提升 
，从而带动了整体毛利率的增长。                                                                            
    3、公司在具身数据领域的核心竞争优势是什么？                                                           
    答：（1）硬件理解+驾驭壁垒：通过头部主流本体厂商合作经验，深度理解本体硬件性能特性、负载逻辑与异构适配
要点，可快速解决硬件高故障率与稳定性问题；已在北京运营首个具身智能数据训练场，依托100+台机器人实现高效数据
产出。                                                                                                    
    （2）模型理解与落地壁垒：核心团队拥有大模型开发等资深背景，懂模型更懂数据；数据体系精准对齐机器人大脑 
训练范式，提供具备高泛化能力的数据解决方案，支撑具身大脑模型训练。                                        
    （3）综合数据工程化壁垒：不仅具备全球化数据采集与低成本交付资源；同时，自研的AI自动化标注平台与7×24小
时算法质检，兼顾低成本与专家级质量。                                                                      
    4、不同机器人公司之间，是否存在可以共用的数据？                                                       
    答：不同机器人公司之间确实存在可以共用的数据，但需要区分数据类型来看。                                
    目前数据主要分为三类：真机数据、UMI数据、第一人称视角数据。                                           
    从共用难度来看，真机数据很难直接共用，而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视
角数据不绑定具体机器人的关节参数和运动学模型，采集的是“操作过程”本身，理论上可以被不同机器人学习和泛化。
    为什么真机数据很难共用？主要有2个原因：                                                               
    一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同，A公司的“抓取”数据没法直接拿 
去训练B公司的机械臂。                                                                                     
    二是数据格式各自为政，行业缺乏统一的标准和“通用语言”。                                              
    所以行业正在推动的是：让UMI和第一人称这类“本体无关”的数据更多流通共用，同时通过技术对齐和标准统一， 
逐步解决真机数据的跨本体迁移问题。                                                                        
    5、具身智能数据服务的需求逻辑？                                                                       
    答：具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌，而是类似大模型‘涌现
’的范式变革。由于当前仿真环境无法完美模拟物理接触与长尾场景，海量、高泛化度的真实物理交互数据成为训练具身
大脑的唯一‘燃料’，这是具身智能区别于传统自动化的根本逻辑。                                              
    6、客户为何不自己做数据，而选择外部采购？                                                             
    答：数据工程是一项重人力、重流程、重管理的‘苦活累活’，并非算法厂商的核心基因。自建数据团队不仅边际成
本高，且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”，通过规模化、标准化、可伴随客户
迭代而同步迭代的整体数据供应链能力，帮助客户剥离非核心业务，使其聚焦于算法与本体研发，实现产业分工的最优解
。                                                                                                        
    7、具身智能数据赛道能做多久，是否像智驾一样只有短期机会？                                             
    答：这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言，自动驾驶主要解决避障与导航，而具身智能需要
解决非结构化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义，数据需求将伴随机器人进家庭、进工厂的全过
程。我们定位为全行业的数据基础设施，旨在伴随行业全生命周期成长，而非短期套利。                            
─────────────────────────────────────────────────────

参与调研机构：39家
──────┬──────────────────────────────────────────────
  2026-03-24│海天瑞声(688787)2026年3月24日-4月14日投资者关系活动主要内容                                 
──────┴──────────────────────────────────────────────
    北京海天瑞声科技股份有限公司于2026年3月24日-4月14日在线上说明会、线下交流举行投资者关系活动，参与单位 
名称及人员有华龙证券股份有限公司邓鹏怡，国泰海通证券股份有限公司黄晓明，上海磐耀资产管理有限公司徐行余，深
圳市红筹投资有限公司刘俊青，鹏华基金管理有限公司董威，拾贝投资管理有限公司朱晋，银华基金管理股份有限公司刘
宇尘，上市公司接待人员有董事会秘书：张哲，政企事业部总经理：崔向雨，投资者关系负责人：袁璐。 查看原文     
https://data.tdx.com.cn/zxfile/pdf_tb_news_jgdyxx/202604/83115688787.pdf                                  
─────────────────────────────────────────────────────

〖免责条款〗
 1、本公司力求但不保证提供的任何信息的真实性、准确性、完整性及原创性等，投资者使
 用前请自行予以核实，如有错漏请以中国证监会指定上市公司信息披露媒体为准，本公司
 不对因上述信息全部或部分内容而引致的盈亏承担任何责任。
 2、本公司无法保证该项服务能满足用户的要求，也不担保服务不会受中断，对服务的及时
 性、安全性以及出错发生都不作担保。
 3、本公司提供的任何信息仅供投资者参考，不作为投资决策的依据，本公司不对投资者依
 据上述信息进行投资决策所产生的收益和损失承担任何责任。投资有风险，应谨慎至上。
gubit.cn-股比特.中国

查股网