chaguwang.cn-查股网.中国

查股网.CN

 
688787(海天瑞声)最新价值分析报告
 

查询最新价值分析报告(输入股票代码):

研报评级☆ ◇688787 海天瑞声 更新日期:2026-06-10◇ 通达信沪深京F10 ★本栏包括【1.投资评级统计】【2.盈利预测统计】【3.盈利预测明细】【4.研报摘要】 【5.机构调研】 【1.投资评级统计】最新评级日期:2026-05-13 时间段 买入评级次数 增持评级次数 中性评级次数 减持评级次数 卖出评级次数 评级次数合计 ──────────────────────────────────────────────── 1月内 1 0 0 0 0 1 2月内 2 1 0 0 0 3 3月内 2 1 0 0 0 3 6月内 2 1 0 0 0 3 1年内 2 1 0 0 0 3 ──────────────────────────────────────────────── 【2.盈利预测统计】(近6个月) ┌──────────┬─────┬─────┬─────┬─────┬─────┬─────┐ │财务指标 │ 2023年│ 2024年│ 2025年│2026年预测│2027年预测│2028年预测│ ├──────────┼─────┼─────┼─────┼─────┼─────┼─────┤ │每股收益(元) │ -0.50│ 0.19│ 0.23│ 0.69│ 1.07│ 1.65│ │每股净资产(元) │ 12.97│ 12.32│ 12.30│ 12.77│ 13.49│ 14.60│ │净资产收益率% │ -3.88│ 1.53│ 1.90│ 5.38│ 8.01│ 11.33│ │归母净利润(百万元) │ -30.39│ 11.34│ 14.12│ 41.37│ 64.58│ 99.42│ │营业收入(百万元) │ 170.01│ 237.08│ 376.97│ 541.68│ 745.14│ 999.83│ │营业利润(百万元) │ -42.78│ 10.63│ 15.12│ 45.00│ 70.00│ 106.33│ └──────────┴─────┴─────┴─────┴─────┴─────┴─────┘ 【3.盈利预测明细】(近6个月) 日期 评级 评级变化 目标价 2026EPS 2027EPS 2028EPS 研究机构 ──────────────────────────────────────────────── 2026-05-13 买入 首次 188.39 0.62 1.00 1.53 国泰海通 2026-05-08 增持 维持 --- 0.51 0.75 1.15 华创证券 2026-04-24 买入 维持 --- 0.93 1.47 2.26 东吴证券 ──────────────────────────────────────────────── 【4.研报摘要】(近6个月) ──────┬──────────────────────────────────┬──────┬──── 2026-05-13│海天瑞声(688787)首次覆盖报告:AI数据智能工厂,数据训练稀缺龙头 │国泰海通 │买入 ──────┴──────────────────────────────────┴──────┴──── 本报告导读:公司致力于研发和生产高质量、大规模、结构化的训练数据,为算法模型的训练拓展提供可靠素材,是 AI时代的数据生产智能工厂。 投资要点:首次覆盖,给予“增持”评级。我们预测公司2026-2028年归母净利润分别为0.37/0.60/0.92亿元,对应E PS分别为0.62、1.00、1.53元。我们结合PE和PS的方法对公司进行估值,最终给予公司目标市值114亿元,对应目标价为1 88.39元,首次覆盖,给予“增持”评级。 数据训练龙头,AI数据生产的智能工厂。公司成立于2005年,致力于研发和生产高质量、大规模、结构化的训练数据 ,为算法模型的训练拓展提供可靠训练素材,助力AI商业化落地。公司生产的模型训练数据涵盖智能语音、计算机视觉及 自然语言处理三大核心领域,交付形式包括标准化产品和定制化服务,公司还外延提供与训练数据相关的应用服务。截止 2025年底,公司累计客户数量超过1200家,覆盖科技互联网、社交、IoT、具身智能、智能驾驶、大模型等领域的主流企 业,以及政企、教育科研机构。 高质量训练数据是AI规模化应用的核心“燃料”。作为大模型学习、训练和验证的“燃料”基础,大规模、高质量的 数据集对于模型能力的提升愈加重要,当前高质量数据短缺已成为AI规模化落地的关键制约。2025年6月,Meta以148亿美 元收购数据标注初创公司ScaleAI49%股权,充分凸显AI时代数据的价值。根据Cognilytica统计数据,预计2027年全球AI 训练数据市场规模将达到220亿美元,2021-2027年复合增长率达32%。 下游需求爆发,公司业绩增长步入快车道。2025年公司实现营收3.77亿元,同比+59.00%;归母利润0.14亿元,同比+ 24.54%;收入和利润均实现快速增长,延续2024年趋势。伴随多模态模型技术突破和AI应用场景落地加速,AI训练数据需 求爆发,公司凭借丰富的数据集积累和服务经验,持续获得海内外头部科技企业订单,业绩已步入快速增长通道。 风险提示:AI技术迭代风险,AI应用落地不及预期,行业竞争加剧风险。 ──────┬──────────────────────────────────┬──────┬──── 2026-05-08│海天瑞声(688787)2025年报及2026年一季报点评:具身智能前瞻卡位,数据要│华创证券 │增持 │素价值释放 │ │ ──────┴──────────────────────────────────┴──────┴──── 事项: 公司发布2025年报及2026年一季报,2025年实现营业收入3.77亿元,同比+59.00%;实现归母净利润0.14亿元,同比+ 24.54%。2026Q1实现营业收入9,677.93万元,同比+38.63%;实现归母净利润840.30万元,同比+2,161.14%。 评论: 业绩高速增长,业务结构向多模态和定制化加速转型。2025年公司业绩实现高速增长,主要受益于全球人工智能产业 迈向“规模化落地”,训练数据业务迎来强劲增长。分业务看,计算机视觉业务实现收入1.48亿元,同比+217.66%;自然 语言业务实现收入0.51亿元,同比+112.29%,成为增长核心引擎,训练数据相关的应用服务业务实现收入0.28亿元,同比 +1390.69%,表现亮眼;传统优势的智能语音业务收入实现收入为1.50亿元,同比-8.66%。公司业务结构正发生深刻变化 ,毛利较低的定制服务收入占比持续抬升,反映了头部客户为打造模型差异化而寻求独特数据的行业趋势,受此影响,公 司整体毛利率下降18.38pct至48.08%。 境内外业务齐头并进,数据要素打开G端新空间。公司全球化战略成效初显,2025年境外业务实现收入1.58亿元,同 比+38.68%,其中东南亚数据交付基地已进入稳定运营阶段,为海外定制化服务市场贡献了显著增量。境内业务实现收入2 .19亿元,同比+77.72%,增长动能强劲。公司凭借丰富的数据服务经验以及海量标品数据集积累,持续获得国内外头部科 技企业的数据需求订单。公司紧抓“数据要素X”战略机遇,地方政府积极布局结合各地产业特色的人工智能应用,公司 为相关项目交付垂直领域AI模型及应用平台,并助力地方政府建设针对地方产业特色的高质量数据集,推动数据资源向资 产化、价值化转化,已与成都、长沙、保定等城市合作共建数据标注基地,2026Q1公司新签订单及确认合作待签署订单同 比增长超100%,在手订单充足、结构优质,为全年持续良性增长奠定坚实基础。 前瞻布局具身智能,构筑第二成长曲线。公司精准把握具身智能作为AGI关键路径的发展趋势,将数据视为其核心瓶 颈,进行前瞻性战略布局。公司已组建具身智能数据专项团队,并开始在全国多个城市启动项目落地,与国内头部机器人 本体厂商展开合作,推动人形机器人在千行百业的规模化应用。2026年,公司将加快具身智能数据训练场方案落地与数据 资源储备,持续深化与头部机器人本体厂商、科技大厂、相关地方政府的合作,为具身智能产业的发展提供坚实的数据支 撑。 投资建议:考虑到公司在数据要素和具身智能等新兴领域布局领先,商业化落地进程超预期,同时受益于头部大厂AI 投入及地方政府数据要素投入加大。我们预计2026-2028年公司营收分别为5.49/7.62/10.55亿元,对应增速分别为45.6%/ 38.9%/38.4%;归母净利润分别为0.31/0/.45/0.70亿元,对应增速分别为117.5%/48.1%/53.1%,对应EPS为0.51/0.75/1.1 5元,维持“推荐”评级。 风险提示:AI技术发展不及预期;数据要素政策落地不及预期。 ──────┬──────────────────────────────────┬──────┬──── 2026-04-24│海天瑞声(688787)2025年报&2026一季报点评:业绩持续高增 │东吴证券 │买入 ──────┴──────────────────────────────────┴──────┴──── 事件:公司发布2025年报&2026一季报,公司2025年营收3.77亿元,同比增长59%;归母净利润0.14亿元,同比增长25 %。2026年Q1营收0.97亿元,同比增长39%;归母净利润0.08亿元,同比增长2161%,符合市场预期。 投资要点 收入持续高增:分业务来看,公司2025年计算机视觉业务收入1.48亿元,同比+218%;自然语言业务收入0.51亿元, 同比+112%;智能语音业务收入1.50亿元,同比-9%;训练数据相关应用服务收入0.28亿元,同比+1394%。2026Q1公司营收 持续高增,主要系1)国内外头部大厂加大视频、文本等方面AI数据投入;2)地方数据标注基地项目建设加快推进;3) 东南亚数据交付基地完成产能爬坡。公司2025年毛利率48%,同比下滑,主要受定制化服务业务收入占比提升影响。2026Q 1公司相对高毛利的训练数据应用服务收入占比提升,整体毛利率改善至56%。 模型迭代加速推动需求快速提升:随着AIAgent、文生视频、AI编程等场景开始大规模应用,大模型以及垂类场景应 用迭代速度不断加快,推动客户采购高质量专业数据的需求量和复杂度提升。公司多年服务阿里巴巴、字节跳动、腾讯、 中国移动等头部客户,已成为多家行业领先企业的核心数据服务供应商,率先受益。除大厂外,公司积极拓展政府和央国 企客户,已为广西、四川等地打造多类特色数据集,并同步推进湖南、内蒙古等地的专项数据集建设。2026年3月,世界 数据组织成立,海天瑞声以发起单位身份深度融入。我们预计未来公司将继续推进和地方政府共建高质量数据集,推动数 据标注平台和应用落地。 全球化布局持续优化:公司进一步强化北美、欧洲及日韩销售团队,深化本地化服务能力,公司在东南亚新建的数据 交付基地已进入稳定运营阶段,为海外业务贡献了显著的增量收入,未来将成为支撑公司全球化战略的重要支点。 拓展具身智能等新场景:具身智能需要机器人在复杂的真实世界中实现自主感知、学习和适应,该能力的构建依赖海 量来自“真实物理环境”的动态交互数据进行训练。目前相关数据获取成本高、覆盖场景有限,供需缺口非常大。公司已 与国内某头部具身厂商签署真机数据采集合约,并与多家头部具身厂商、科技大厂及地方政府启动订单对接,有望成为公 司新的增长点。 盈利预测与投资评级:高质量数据集是人工智能发展的基础,公司是A股稀缺的专注提供AI训练数据解决方案的领军 企业,2026Q1新签订单及确认合作待签署订单同比增长超100%,业绩有望持续高增,我们将公司2026-2027年EPS由0.92/1 .50元调整至0.93/1.47元,预计2028年EPS为2.26元,维持“买入”评级。 风险提示:行业竞争加剧,项目回款不及预期,研发进展不及预期。 【5.机构调研】(近6个月) 参与调研机构:33家 ──────┬────────────────────────────────────────────── 2026-06-08│海天瑞声(688787)2026年6月8日投资者关系活动主要内容 ──────┴────────────────────────────────────────────── 1、一季度公司毛利率提升的原因是什么? 答:2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛利的政府平台类业务在 本季度显著起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理平台及方案,相比传统 定制化的数据采集与标注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显,因此毛利率水平更高。 2026年第一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构中的占比明显提升 ,从而带动了整体毛利率的增长。 2、后训练和强化学习阶段,对数据标注需求有哪些变化? 答:在后训练和强化学习(RLHF/GRPO)阶段,模型的目标从“预训练期学会语言统计规律”转向“对齐人类偏好, 这对标注数据的需求产生了深刻变化。 (1)从“量”到“质”与“复杂度”的转变 后训练阶段不再需要海量的原始文本,转而需要高质量、细粒度、领域专家级的标注数据。例如,SFT(监督微调) 依赖精确的“标准答案”,而RL训练则需要能区分“好/较好/差”的偏好排序数据。 (2)聚焦“难例”与“长尾”场景 在RL阶段,“难例”(模型初始成功率低的数据)的价值远超易例,且能极大增强模型的泛化能力。标注重点从普遍 规律转向稀缺、复杂的边界案例。 3、公司在具身数据领域的核心竞争优势是什么? 答:(1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验,深度理解本体硬件性能特性、负载逻辑与异构适配 要点,可快速解决硬件高故障率与稳定性问题;已在北京运营首个具身智能数据训练场,依托100+台机器人实现高效数据 产出。 (2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背景,懂模型更懂数据;数据体系精准对齐机器人大脑 训练范式,提供具备高泛化能力的数据解决方案,支撑具身大脑模型训练。 (3)综合数据工程化壁垒:不仅具备全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×24小 时算法质检,兼顾低成本与专家级质量。 4、不同机器人公司之间,是否存在可以共用的数据? 答:不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。 目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。 从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视 角数据不绑定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。 为什么真机数据很难共用?主要有2个原因: 一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿 去训练B公司的机械臂。 二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。 所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一, 逐步解决真机数据的跨本体迁移问题。 5、具身智能数据服务的需求逻辑? 答:具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌,而是类似大模型‘涌现 ’的范式变革。由于当前仿真环境无法完美模拟物理接触与长尾场景,海量、高泛化度的真实物理交互数据成为训练具身 大脑的唯一‘燃料’,这是具身智能区别于传统自动化的根本逻辑。 6、具身客户为何不自己做数据,而选择外部采购? 答:数据工程是一项重人力、重流程、重管理的‘苦活累活’,并非算法厂商的核心基因。自建数据团队不仅边际成 本高,且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”,通过规模化、标准化、可伴随客户 迭代而同步迭代的整体数据供应链能力,帮助客户剥离非核心业务,使其聚焦于算法与本体研发,实现产业分工的最优解 。 7、具身智能数据赛道能做多久,是否像智驾一样只有短期机会? 答:这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言,自动驾驶主要解决避障与导航,而具身智能需要 解决非结构化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义,数据需求将伴随机器人进家庭、进工厂的全过 程。我们定位为全行业的数据基础设施,旨在伴随行业全生命周期成长,而非短期套利 ───────────────────────────────────────────────────── 参与调研机构:15家 ──────┬────────────────────────────────────────────── 2026-06-05│海天瑞声(688787)2026年6月5日投资者关系活动主要内容 ──────┴────────────────────────────────────────────── 1、WDO成立之后,您认为会对整个AI数据行业的格局、合规与商业化带来哪些影响? 答:尊敬的投资者:您好,WDO(世界数据组织)于2026年3月在北京成立,是全球首个专注于数据治理的非政府、非 营利性国际组织,已汇集40多国200余家会员单位。其对数据行业的影响主要体现在以下几个方面: (1)填补全球治理 空白 此前全球缺乏专门协调数据政策的专业机构,各国规则割裂。WDO搭建统一对话平台,推动从单一“规则”导向转向 “规则+标准”并重,引入“集体数据治理”新范式。 (2)降低跨境合规成本 各国数据政策差异导致企业跨国运营合规 成本高昂。WDO推动行业共识与标准互认,有望实现“一次评估、多国互认”,降低企业数据合作成本,提升政策可预期 性。 (3)促进数据有序流动 WDO为数据跨境流动提供制度供给,打通堵点,带动数字贸易与科技创新。 (4)赋能全球 南方国家 WDO将发展中国家数据能力建设作为重点,通过技术援助缩小数字鸿沟。数据无价值差的特性使南方国家在数字 贸易中可与发达国家站在同一起跑线,放大其在存储、算力、人力成本等方面的优势。 (5)加速国内数据要素国际化 国内33家数据交易所活跃度预期将获提升,首批跨国数据产品挂牌可期。标准互认倒逼合规体系建设,具备跨境合规能力 的企业优先受益,中国数据治理经验可向国际输出。 (6)推动产业生态落地 聚焦医疗、教育等场景推动项目落地,提 炼可复制解决方案,促进全球数字产业协同。 2、公司参与WDO的初衷是什么?在其中承担怎样的角色与定位? 答:尊敬的投资者:您好,海天瑞声作为仅有的少数几家企业发起单位之一参与其中,并荣膺首届理事单位,也是AI 数据领域唯一入选的企业。WDO选中海天瑞声,是基于公司深耕AI训练数据领域超过20年的积累——公司已形成覆盖数据 采集、处理、标注、治理到应用落地的全链条能力体系,拥有覆盖全球300多个语种的多模态数据资源,累计服务全球上 千家科技企业与科研机构。公司的定位是借助WDO平台深度参与全球数据治理体系建设:一是推动数据质量、生产流程等 标准的国际互认,输出工程化、规模化数据治理经验;二是依托对WDO规则和框架的深度理解,在现有出海基础上进一步 提升全球化业务拓展效率;三是作为理事单位,持续发挥产业实践优势,推动数据标准共建与生态协同。 3、为什么机器人厂商倾向于外购数据服务而不是自建团队? 答:尊敬的投资者:您好,数据工程是一项重人力、重流程、重管理的‘苦活累活’,并非算法厂商的核心基因。自 建数据团队不仅边际成本高,且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”,通过规模化 、标准化、可伴随客户迭代而同步迭代的整体数据供应链能力,帮助客户剥离非核心业务,使其聚焦于算法与本体研发, 实现产业分工的最优解。 4、大模型进入后训练与强化学习阶段后,对数据标注的需求发生了哪些关键变化? 答:尊敬的投资者,您好:在后训练和强化学习(RLHF/GRPO)阶段,模型的目标从“预训练期学会语言统计规律” 转向“对齐人类偏好,这对标注数据的需求产生了深刻变化。 (1)从“量”到“质”与“复杂度”的转变 后训练阶段 不再需要海量的原始文本,转而需要高质量、细粒度、领域专家级的标注数据。例如,SFT(监督微调)依赖精确的“标 准答案”,而RL训练则需要能区分“好/较好/差”的偏好排序数据。 (2)聚焦“难例”与“长尾”场景 在RL阶段,“ 难例”(模型初始成功率低的数据)的价值远超易例,且能极大增强模型的泛化能力。标注重点从普遍规律转向稀缺、复 杂的边界案例。 5、管理层如何看待当前具身智能赛道的发展阶段与未来空间? 答:尊敬的投资者:您好,公司高度看好具身智能数据这一新兴赛道,已将其作为战略重点进行前瞻布局,并组建了 专项团队加快业务落地。 从行业前景看,具身智能已被国家列为未来产业重点培育方向。当前,机器人“大脑”认知决 策等核心能力仍处于发展早期,大模型泛化能力尚未成熟,规模化落地亟需海量高质量、细颗粒度的训练数据支撑,市场 空间广阔。 从市场需求看,国内外头部科技企业与本体厂商已启动规模化数据采购,需求覆盖真实场景交互数据、第一 人称视角数据、UMI数据、仿真数据等。与此同时,部分地方政府正积极规划“具身智能训练场”,以工程化方式生产高 质量数据,赋能产业应用。 目前,公司已与国内某头部具身厂商签署真机数据采集合约,并与多家头部具身厂商、科技 大厂及地方政府启动订单对接,正稳步推进样例数据方案的设计与落地,为具身智能数据业务的规模化发展蓄力筑基。 6、不同机器人厂商之间,是否存在可通用、可复用的数据? 答:尊敬的投资的者:您好,不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。 目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。 从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视 角数据不绑定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。 为什么真机数据很难共用?主要有2个原因: 一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿 去训练B公司的机械臂。 二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。 所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一, 逐步解决真机数据的跨本体迁移问题。 7、公司2026年第一季度实现较快收入增长,能否详细拆解一下核心驱动因素? 答:尊敬的投资者:您好,2026年第一季度,公司实现营业收入9,677.93万元,同比增长38.63%,受益于AI应用爆发 与数据要素产业化提速,业绩增长强劲。 全球AI竞争加剧,高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业,传统业务凭借全品类、规模化 、高合规优势稳健增长。同时,ToG可信数据空间业务实现突破,与国家级数据标注试点城市深度合作,提供全栈解决方 案,开辟政务与公共数据新增长曲线。此外,公司东南亚数据交付基地完成产能爬坡,全球化交付能力与竞争力提升。以 上因素共同驱动公司业务的高速增长。 8、一季度公司毛利率同比有所提升,主要是什么原因带来的? 答:尊敬的投资者:您好,2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛 利的政府平台类业务在本季度显著起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理 平台及方案,相比传统定制化的数据采集与标注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显, 因此毛利率水平更高。 2026年第一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构 中的占比明显提升,从而带动了整体毛利率的增长。 9、请问李总,在具身智能数据这个赛道上,公司相比同行最核心的竞争壁垒体现在哪些方面? 答:尊敬的投资者,您好,公司的核心壁垒体现在: (1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验, 深度理解本体硬件性能特性、负载逻辑与异构适配要点,可快速解决硬件高故障率与稳定性问题;已在北京运营首个具身 智能数据训练场,依托100+台机器人实现高效数据产出。 (2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背 景,懂模型更懂数据;数据体系精准对齐机器人大脑训练范式,提供具备高泛化能力的数据解决方案,支撑具身大脑模型 训练。 (3)综合数据工程化壁垒:不仅具备全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×2 4小时算法质检,兼顾低成本与专家级质量。 10、具身智能数据服务的需求逻辑? 答:具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌,而是类似大模型‘涌现 ’的范式变革。由于当前仿真环境无法完美模拟物理接触与长尾场景,海量、高泛化度的真实物理交互数据成为训练具身 大脑的唯一‘燃料’,这是具身智能区别于传统自动化的根本逻辑。 11、具身智能数据赛道能做多久,是否像智驾一样只有短期机会? 答:这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言,自动驾驶主要解决避障与导航,而具身智能需要 解决非结构化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义,数据需求将伴随机器人进家庭、进工厂的全过 程。我们定位为全行业的数据基础设施,旨在伴随行业全生命周期成长,而非短期套利。 ───────────────────────────────────────────────────── 参与调研机构:96家 ──────┬────────────────────────────────────────────── 2026-05-14│海天瑞声(688787)2026年5月14日投资者关系活动主要内容 ──────┴────────────────────────────────────────────── 1、公司第一季度收入增长原因是什么? 答:2026年第一季度,公司实现营业收入9,677.93万元,同比增长38.63%,受益于AI应用爆发与数据要素产业化提速 ,业绩增长强劲。 全球AI竞争加剧,高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业,传统业务凭借全品类、规模化 、高合规优势稳健增长。同时,ToG可信数据空间业务实现突破,与国家级数据标注试点城市深度合作,提供全栈解决方 案,开辟政务与公共数据新增长曲线。此外,公司东南亚数据交付基地完成产能爬坡,全球化交付能力与竞争力提升。以 上因素共同驱动公司业务的高速增长。 2、一季度公司毛利率提升的原因是什么? 答:2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛利的政府平台类业务在 本季度显著起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理平台及方案,相比传统 定制化的数据采集与标注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显,因此毛利率水平更高。 2026年第一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构中的占比明显提升 ,从而带动了整体毛利率的增长。 3、公司在具身数据领域的核心竞争优势是什么? 答:(1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验,深度理解本体硬件性能特性、负载逻辑与异构适配 要点,可快速解决硬件高故障率与稳定性问题;已在北京运营首个具身智能数据训练场,依托100+台机器人实现高效数据 产出。 (2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背景,懂模型更懂数据;数据体系精准对齐机器人大脑 训练范式,提供具备高泛化能力的数据解决方案,支撑具身大脑模型训练。 (3)综合数据工程化壁垒:不仅具备全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×24小 时算法质检,兼顾低成本与专家级质量。 4、不同机器人公司之间,是否存在可以共用的数据? 答:不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。 目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。 从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视 角数据不绑定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。 为什么真机数据很难共用?主要有2个原因: 一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿 去训练B公司的机械臂。 二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。 所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一, 逐步解决真机数据的跨本体迁移问题。 5、后训练和强化学习阶段,对数据标注需求有哪些变化? 答:在后训练和强化学习(RLHF/GRPO)阶段,模型的目标从“预训练期学会语言统计规律”转向“对齐人类偏好, 这对标注数据的需求产生了深刻变化。 (1)从“量”到“质”与“复杂度”的转变 后训练阶段不再需要海量的原始文本,转而需要高质量、细粒度、领域专家级的标注数据。例如,SFT(监督微调) 依赖精确的“标准答案”,而RL训练则需要能区分“好/较好/差”的偏好排序数据。 (2)聚焦“难例”与“长尾”场景 在RL阶段,“难例”(模型初始成功率低的数据)的价值远超易例,且能极大增强模型的泛化能力。标注重点从普遍 规律转向稀缺、复杂的边界案例。 6、客户为何不自己做数据,而选择外部采购? 答:数据工程是一项重人力、重流程、重管理的‘苦活累活’,并非算法厂商的核心基因。自建数据团队不仅边际成 本高,且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”,通过规模化、标准化、可伴随客

www.chaguwang.cn & ddx.gubit.cn 查股网提供数据 商务合作广告联系 QQ:767871486