公司报道☆ ◇688787 海天瑞声 更新日期:2026-06-10◇ 通达信沪深京F10
─────────┬────────────────────────────────────────────────
2026-06-08 16:59│海天瑞声(688787)2026年6月8日投资者关系活动主要内容
─────────┴────────────────────────────────────────────────
1、一季度公司毛利率提升的原因是什么?
答:2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛利的政府平台类业务在本季度显著
起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理平台及方案,相比传统定制化的数据采集与标
注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显,因此毛利率水平更高。
2026年第一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构中的占比明显提升,从而带动
了整体毛利率的增长。
2、后训练和强化学习阶段,对数据标注需求有哪些变化?
答:在后训练和强化学习(RLHF/GRPO)阶段,模型的目标从“预训练期学会语言统计规律”转向“对齐人类偏好,这对标注数
据的需求产生了深刻变化。
(1)从“量”到“质”与“复杂度”的转变
后训练阶段不再需要海量的原始文本,转而需要高质量、细粒度、领域专家级的标注数据。例如,SFT(监督微调)依赖精确的
“标准答案”,而RL训练则需要能区分“好/较好/差”的偏好排序数据。
(2)聚焦“难例”与“长尾”场景
在RL阶段,“难例”(模型初始成功率低的数据)的价值远超易例,且能极大增强模型的泛化能力。标注重点从普遍规律转向稀
缺、复杂的边界案例。
3、公司在具身数据领域的核心竞争优势是什么?
答:(1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验,深度理解本体硬件性能特性、负载逻辑与异构适配要点,可快
速解决硬件高故障率与稳定性问题;已在北京运营首个具身智能数据训练场,依托100+台机器人实现高效数据产出。
(2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背景,懂模型更懂数据;数据体系精准对齐机器人大脑训练范式,
提供具备高泛化能力的数据解决方案,支撑具身大脑模型训练。
(3)综合数据工程化壁垒:不仅具备全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×24小时算法质检
,兼顾低成本与专家级质量。
4、不同机器人公司之间,是否存在可以共用的数据?
答:不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。
目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。
从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视角数据不绑
定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。
为什么真机数据很难共用?主要有2个原因:
一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿去训练B公司
的机械臂。
二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。
所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一,逐步解决真
机数据的跨本体迁移问题。
5、具身智能数据服务的需求逻辑?
答:具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌,而是类似大模型‘涌现’的范式变
革。由于当前仿真环境无法完美模拟物理接触与长尾场景,海量、高泛化度的真实物理交互数据成为训练具身大脑的唯一‘燃料’,
这是具身智能区别于传统自动化的根本逻辑。
6、具身客户为何不自己做数据,而选择外部采购?
答:数据工程是一项重人力、重流程、重管理的‘苦活累活’,并非算法厂商的核心基因。自建数据团队不仅边际成本高,且难
以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”,通过规模化、标准化、可伴随客户迭代而同步迭代的整体
数据供应链能力,帮助客户剥离非核心业务,使其聚焦于算法与本体研发,实现产业分工的最优解。
7、具身智能数据赛道能做多久,是否像智驾一样只有短期机会?
答:这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言,自动驾驶主要解决避障与导航,而具身智能需要解决非结构
化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义,数据需求将伴随机器人进家庭、进工厂的全过程。我们定位为全行业
的数据基础设施,旨在伴随行业全生命周期成长,而非短期套利
https://data.tdx.com.cn/zxfile/pdf_tb_news_jgdyxx/202606/88747688787.pdf
─────────┬────────────────────────────────────────────────
2026-06-05 18:41│海天瑞声(688787)2026年6月5日投资者关系活动主要内容
─────────┴────────────────────────────────────────────────
1、WDO成立之后,您认为会对整个AI数据行业的格局、合规与商业化带来哪些影响?
答:尊敬的投资者:您好,WDO(世界数据组织)于2026年3月在北京成立,是全球首个专注于数据治理的非政府、非营利性国际
组织,已汇集40多国200余家会员单位。其对数据行业的影响主要体现在以下几个方面: (1)填补全球治理空白 此前全球缺乏专门
协调数据政策的专业机构,各国规则割裂。WDO搭建统一对话平台,推动从单一“规则”导向转向“规则+标准”并重,引入“集体数
据治理”新范式。 (2)降低跨境合规成本 各国数据政策差异导致企业跨国运营合规成本高昂。WDO推动行业共识与标准互认,有望
实现“一次评估、多国互认”,降低企业数据合作成本,提升政策可预期性。 (3)促进数据有序流动 WDO为数据跨境流动提供制度
供给,打通堵点,带动数字贸易与科技创新。 (4)赋能全球南方国家 WDO将发展中国家数据能力建设作为重点,通过技术援助缩小
数字鸿沟。数据无价值差的特性使南方国家在数字贸易中可与发达国家站在同一起跑线,放大其在存储、算力、人力成本等方面的优
势。 (5)加速国内数据要素国际化 国内33家数据交易所活跃度预期将获提升,首批跨国数据产品挂牌可期。标准互认倒逼合规体
系建设,具备跨境合规能力的企业优先受益,中国数据治理经验可向国际输出。 (6)推动产业生态落地 聚焦医疗、教育等场景推
动项目落地,提炼可复制解决方案,促进全球数字产业协同。
2、公司参与WDO的初衷是什么?在其中承担怎样的角色与定位?
答:尊敬的投资者:您好,海天瑞声作为仅有的少数几家企业发起单位之一参与其中,并荣膺首届理事单位,也是AI数据领域唯
一入选的企业。WDO选中海天瑞声,是基于公司深耕AI训练数据领域超过20年的积累——公司已形成覆盖数据采集、处理、标注、治
理到应用落地的全链条能力体系,拥有覆盖全球300多个语种的多模态数据资源,累计服务全球上千家科技企业与科研机构。公司的
定位是借助WDO平台深度参与全球数据治理体系建设:一是推动数据质量、生产流程等标准的国际互认,输出工程化、规模化数据治
理经验;二是依托对WDO规则和框架的深度理解,在现有出海基础上进一步提升全球化业务拓展效率;三是作为理事单位,持续发挥
产业实践优势,推动数据标准共建与生态协同。
3、为什么机器人厂商倾向于外购数据服务而不是自建团队?
答:尊敬的投资者:您好,数据工程是一项重人力、重流程、重管理的‘苦活累活’,并非算法厂商的核心基因。自建数据团队
不仅边际成本高,且难以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”,通过规模化、标准化、可伴随客户
迭代而同步迭代的整体数据供应链能力,帮助客户剥离非核心业务,使其聚焦于算法与本体研发,实现产业分工的最优解。
4、大模型进入后训练与强化学习阶段后,对数据标注的需求发生了哪些关键变化?
答:尊敬的投资者,您好:在后训练和强化学习(RLHF/GRPO)阶段,模型的目标从“预训练期学会语言统计规律”转向“对齐
人类偏好,这对标注数据的需求产生了深刻变化。 (1)从“量”到“质”与“复杂度”的转变 后训练阶段不再需要海量的原始文
本,转而需要高质量、细粒度、领域专家级的标注数据。例如,SFT(监督微调)依赖精确的“标准答案”,而RL训练则需要能区分
“好/较好/差”的偏好排序数据。 (2)聚焦“难例”与“长尾”场景 在RL阶段,“难例”(模型初始成功率低的数据)的价值远
超易例,且能极大增强模型的泛化能力。标注重点从普遍规律转向稀缺、复杂的边界案例。
5、管理层如何看待当前具身智能赛道的发展阶段与未来空间?
答:尊敬的投资者:您好,公司高度看好具身智能数据这一新兴赛道,已将其作为战略重点进行前瞻布局,并组建了专项团队加
快业务落地。 从行业前景看,具身智能已被国家列为未来产业重点培育方向。当前,机器人“大脑”认知决策等核心能力仍处于发
展早期,大模型泛化能力尚未成熟,规模化落地亟需海量高质量、细颗粒度的训练数据支撑,市场空间广阔。 从市场需求看,国内
外头部科技企业与本体厂商已启动规模化数据采购,需求覆盖真实场景交互数据、第一人称视角数据、UMI数据、仿真数据等。与此
同时,部分地方政府正积极规划“具身智能训练场”,以工程化方式生产高质量数据,赋能产业应用。 目前,公司已与国内某头部
具身厂商签署真机数据采集合约,并与多家头部具身厂商、科技大厂及地方政府启动订单对接,正稳步推进样例数据方案的设计与落
地,为具身智能数据业务的规模化发展蓄力筑基。
6、不同机器人厂商之间,是否存在可通用、可复用的数据?
答:尊敬的投资的者:您好,不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。
目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。
从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视角数据不绑
定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。
为什么真机数据很难共用?主要有2个原因:
一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿去训练B公司
的机械臂。
二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。
所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一,逐步解决真
机数据的跨本体迁移问题。
7、公司2026年第一季度实现较快收入增长,能否详细拆解一下核心驱动因素?
答:尊敬的投资者:您好,2026年第一季度,公司实现营业收入9,677.93万元,同比增长38.63%,受益于AI应用爆发与数据要素
产业化提速,业绩增长强劲。
全球AI竞争加剧,高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业,传统业务凭借全品类、规模化、高合规优
势稳健增长。同时,ToG可信数据空间业务实现突破,与国家级数据标注试点城市深度合作,提供全栈解决方案,开辟政务与公共数
据新增长曲线。此外,公司东南亚数据交付基地完成产能爬坡,全球化交付能力与竞争力提升。以上因素共同驱动公司业务的高速增
长。
8、一季度公司毛利率同比有所提升,主要是什么原因带来的?
答:尊敬的投资者:您好,2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛利的政府平
台类业务在本季度显著起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理平台及方案,相比传统
定制化的数据采集与标注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显,因此毛利率水平更高。 2026年第
一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构中的占比明显提升,从而带动了整体毛利率
的增长。
9、请问李总,在具身智能数据这个赛道上,公司相比同行最核心的竞争壁垒体现在哪些方面?
答:尊敬的投资者,您好,公司的核心壁垒体现在: (1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验,深度理解本
体硬件性能特性、负载逻辑与异构适配要点,可快速解决硬件高故障率与稳定性问题;已在北京运营首个具身智能数据训练场,依托
100+台机器人实现高效数据产出。 (2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背景,懂模型更懂数据;数据体系精
准对齐机器人大脑训练范式,提供具备高泛化能力的数据解决方案,支撑具身大脑模型训练。 (3)综合数据工程化壁垒:不仅具备
全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×24小时算法质检,兼顾低成本与专家级质量。
10、具身智能数据服务的需求逻辑?
答:具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌,而是类似大模型‘涌现’的范式变
革。由于当前仿真环境无法完美模拟物理接触与长尾场景,海量、高泛化度的真实物理交互数据成为训练具身大脑的唯一‘燃料’,
这是具身智能区别于传统自动化的根本逻辑。
11、具身智能数据赛道能做多久,是否像智驾一样只有短期机会?
答:这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言,自动驾驶主要解决避障与导航,而具身智能需要解决非结构
化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义,数据需求将伴随机器人进家庭、进工厂的全过程。我们定位为全行业
的数据基础设施,旨在伴随行业全生命周期成长,而非短期套利。
https://data.tdx.com.cn/zxfile/pdf_tb_news_jgdyxx/202606/88698688787.pdf
─────────┬────────────────────────────────────────────────
2026-05-18 18:50│海天瑞声(688787):中毅安合计减持2.9521%公司股份
─────────┴────────────────────────────────────────────────
格隆汇5月18日丨海天瑞声(688787.SH)公布,近日,公司收到股东贺琳、中毅安出具的《上市公司股份减持结果告知函》,中毅
安通过集中竞价方式减持所持有的公司股份603,251股,占公司目前总股本的1.0000%;中毅安通过大宗交易方式减持所持有的公司股
份1,177,606股,占公司目前总股本的1.9521%,股东贺琳未进行减持。截至本公告披露日,股东贺琳、中毅安本次减持计划已实施完毕
。
https://www.gelonghui.com/news/5235576
─────────┬────────────────────────────────────────────────
2026-05-15 19:01│5月15日海天瑞声发布公告,股东减持47.99万股
─────────┴────────────────────────────────────────────────
5月15日,海天瑞声公告称,持股5%以上股东宁波中毅安创业投资合伙企业于5月8日至15日合计减持47.99万股,占公司总股本0.
7956%。减持期间,公司股票股价微跌0.27%,截至5月15日收盘报143.78元。此次权益变动触及1%刻度,公司及时进行了信息披露。.
..
https://stock.stockstar.com/RB2026051500035964.shtml
─────────┬────────────────────────────────────────────────
2026-05-14 20:00│海天瑞声(688787)2026年5月14日投资者关系活动主要内容
─────────┴────────────────────────────────────────────────
1、公司第一季度收入增长原因是什么?
答:2026年第一季度,公司实现营业收入9,677.93万元,同比增长38.63%,受益于AI应用爆发与数据要素产业化提速,业绩增长
强劲。
全球AI竞争加剧,高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业,传统业务凭借全品类、规模化、高合规优
势稳健增长。同时,ToG可信数据空间业务实现突破,与国家级数据标注试点城市深度合作,提供全栈解决方案,开辟政务与公共数
据新增长曲线。此外,公司东南亚数据交付基地完成产能爬坡,全球化交付能力与竞争力提升。以上因素共同驱动公司业务的高速增
长。
2、一季度公司毛利率提升的原因是什么?
答:2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛利的政府平台类业务在本季度显著
起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理平台及方案,相比传统定制化的数据采集与标
注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显,因此毛利率水平更高。
2026年第一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构中的占比明显提升,从而带动
了整体毛利率的增长。
3、公司在具身数据领域的核心竞争优势是什么?
答:(1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验,深度理解本体硬件性能特性、负载逻辑与异构适配要点,可快
速解决硬件高故障率与稳定性问题;已在北京运营首个具身智能数据训练场,依托100+台机器人实现高效数据产出。
(2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背景,懂模型更懂数据;数据体系精准对齐机器人大脑训练范式,
提供具备高泛化能力的数据解决方案,支撑具身大脑模型训练。
(3)综合数据工程化壁垒:不仅具备全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×24小时算法质检
,兼顾低成本与专家级质量。
4、不同机器人公司之间,是否存在可以共用的数据?
答:不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。
目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。
从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视角数据不绑
定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。
为什么真机数据很难共用?主要有2个原因:
一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿去训练B公司
的机械臂。
二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。
所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一,逐步解决真
机数据的跨本体迁移问题。
5、后训练和强化学习阶段,对数据标注需求有哪些变化?
答:在后训练和强化学习(RLHF/GRPO)阶段,模型的目标从“预训练期学会语言统计规律”转向“对齐人类偏好,这对标注数
据的需求产生了深刻变化。
(1)从“量”到“质”与“复杂度”的转变
后训练阶段不再需要海量的原始文本,转而需要高质量、细粒度、领域专家级的标注数据。例如,SFT(监督微调)依赖精确的
“标准答案”,而RL训练则需要能区分“好/较好/差”的偏好排序数据。
(2)聚焦“难例”与“长尾”场景
在RL阶段,“难例”(模型初始成功率低的数据)的价值远超易例,且能极大增强模型的泛化能力。标注重点从普遍规律转向稀
缺、复杂的边界案例。
6、客户为何不自己做数据,而选择外部采购?
答:数据工程是一项重人力、重流程、重管理的‘苦活累活’,并非算法厂商的核心基因。自建数据团队不仅边际成本高,且难
以应对波峰波谷的弹性需求。我们定位为“具身智能行业的数据富士康”,通过规模化、标准化、可伴随客户迭代而同步迭代的整体
数据供应链能力,帮助客户剥离非核心业务,使其聚焦于算法与本体研发,实现产业分工的最优解。
7、具身智能数据赛道能做多久,是否像智驾一样只有短期机会?
答:这是一个比自动驾驶更长、更宽的赛道。正如李飞飞教授所言,自动驾驶主要解决避障与导航,而具身智能需要解决非结构
化环境下的复杂物理交互。当前我们甚至还未穷尽场景的定义,数据需求将伴随机器人进家庭、进工厂的全过程。我们定位为全行业
的数据基础设施,旨在伴随行业全生命周期成长,而非短期套利。
8、语音业务的发展趋势?
答:语音业务作为公司的传统优势板块,当前正沿着三个明确方向升级:拟人化、全球化、多场景。这三大趋势共同驱动语音数
据业务从“量的扩张”转向“质的升级”。
第一,拟人化:多情感、多音色成为刚需。
AI交互正从“能听会说”向“拟人化、情感化”迈进。大模型不仅要能识别指令,还要能通过语气、情感、风格进行自然交互。
这要求语音数据覆盖丰富的情感维度和音色特征。公司在此方向已积累大量标准化产品资源,可高效匹配大厂的多情感、多风格语音
交互需求。
第二,全球化:多语种能力决定产品边界。
科技巨头正在加速全球化布局,大模型的多语种覆盖能力直接决定了其产品的市场边界。公司拥有覆盖全球300多种语言的工业
化数据生产网络,以及境外标注基地,能够支持客户AI产品的全球化拓展。
第三,多场景:从通用场景向垂类场景纵深。
语音数据的应用正从最初的通用对话,向医疗、金融、教育、车载等垂直行业深度渗透。垂类场景对数据专业性、术语准确性、
场景真实性的要求远高于通用场景,数据价值密度更高,也为公司带来了更高附加值的业务机会。
9、具身智能数据服务的需求逻辑?
答:具身智能的核心在于赋予机器人具备理解与泛化能力的‘大脑’。这不仅是代码的堆砌,而是类似大模型‘涌现’的范式变
革。由于当前仿真环境无法完美模拟物理接触与长尾场景,海量、高泛化度的真实物理交互数据成为训练具身大脑的唯一‘燃料’,
这是具身智能区别于传统自动化的根本逻辑。
https://data.tdx.com.cn/zxfile/pdf_tb_news_jgdyxx/202605/87414688787.pdf
─────────┬────────────────────────────────────────────────
2026-05-13 20:01│海天瑞声:5月12日至5月13日李科、吕思遥、黄宇凯、郝玉峰、张哲减持股份合计2.89万股
─────────┴────────────────────────────────────────────────
海天瑞声(688787)2026年5月12日至13日,董事李科、副总裁吕思遥及郝玉峰、董事黄宇凯、董秘张哲等五人合计减持2.89万
股,占总股本0.048%。减持期间股价微跌0.95%,收盘报145.29元。数据显示,公司近5日融资净流入超3052万元,融资及融券余额均
有所增加。近90天内,两家机构给予其“买入”和“增持”评级。此次变动属常规高管股份减持。...
https://stock.stockstar.com/RB2026051300040279.shtml
─────────┬────────────────────────────────────────────────
2026-05-13 16:02│公司问答丨海天瑞声:本季度新签订单及确认合作待签署订单同比增长超100% 在手订单充足
─────────┴────────────────────────────────────────────────
海天瑞声回复称,AI训练数据服务行业处于高景气期,大模型对高质量数据需求旺盛。一季度公司营收9677.93万元,同比增长3
8.63%。其中,本季度新签订单及待签署订单同比增速超100%,在手订单充足。在AI应用爆发与数据要素产业化驱动下,公司业绩增
长势能强劲,为全年持续良性增长奠定基础。...
https://www.gelonghui.com/live/2446749
─────────┬────────────────────────────────────────────────
2026-05-13 15:17│海天瑞声(688787)2026年5月13日、14日、20日投资者关系活动主要内容
─────────┴────────────────────────────────────────────────
1、公司第一季度收入增长原因是什么?
答:2026年第一季度,公司实现营业收入9,677.93万元,同比增长38.63%,受益于AI应用爆发与数据要素产业化提速,业绩增长
强劲。
全球AI竞争加剧,高质量训练数据成为核心资源。公司作为国内AI数据服务头部企业,传统业务凭借全品类、规模化、高合规优
势稳健增长。同时,ToG可信数据空间业务实现突破,与国家级数据标注试点城市深度合作,提供全栈解决方案,开辟政务与公共数
据新增长曲线。此外,公司东南亚数据交付基地完成产能爬坡,全球化交付能力与竞争力提升。以上因素共同驱动公司业务的高速增
长。
2、一季度公司毛利率提升的原因是什么?
答:2026年第一季度公司毛利率同比提升,主要得益于业务结构的积极变化,具体来说:高毛利的政府平台类业务在本季度显著
起量。政府(G端)客户的可信数据空间建设,核心是提供标准化程度较高的数据处理平台及方案,相比传统定制化的数据采集与标
注业务,其人力密集程度更低、交付周期更短、边际成本递减效应更明显,因此毛利率水平更高。
2026年第一季度,随着公司前期在G端市场的全面布局进入收获期,这部分高毛利业务在收入结构中的占比明显提升,从而带动
了整体毛利率的增长。
3、公司在具身数据领域的核心竞争优势是什么?
答:(1)硬件理解+驾驭壁垒:通过头部主流本体厂商合作经验,深度理解本体硬件性能特性、负载逻辑与异构适配要点,可快
速解决硬件高故障率与稳定性问题;已在北京运营首个具身智能数据训练场,依托100+台机器人实现高效数据产出。
(2)模型理解与落地壁垒:核心团队拥有大模型开发等资深背景,懂模型更懂数据;数据体系精准对齐机器人大脑训练范式,
提供具备高泛化能力的数据解决方案,支撑具身大脑模型训练。
(3)综合数据工程化壁垒:不仅具备全球化数据采集与低成本交付资源;同时,自研的AI自动化标注平台与7×24小时算法质检
,兼顾低成本与专家级质量。
4、不同机器人公司之间,是否存在可以共用的数据?
答:不同机器人公司之间确实存在可以共用的数据,但需要区分数据类型来看。
目前数据主要分为三类:真机数据、UMI数据、第一人称视角数据。
从共用难度来看,真机数据很难直接共用,而UMI和第一人称视角数据相对更容易跨本体迁移。UMI数据和第一人称视角数据不绑
定具体机器人的关节参数和运动学模型,采集的是“操作过程”本身,理论上可以被不同机器人学习和泛化。
为什么真机数据很难共用?主要有2个原因:
一是硬件本体不统一。不同厂家机器人关节数量、自由度、末端执行器各不相同,A公司的“抓取”数据没法直接拿去训练B公司
的机械臂。
二是数据格式各自为政,行业缺乏统一的标准和“通用语言”。
所以行业正在推动的是:让UMI和第一人称这类“本体无关”的数据更多流通共用,同时通过技术对齐和标准统一,逐步解决真
机数据的跨本体迁移问题。
5、具身智能数据服务的需求逻辑?
|