海天瑞声:华泰联合证券有限责任公司关于北京海天瑞声科技股份有限公司2024年年度持续督导跟踪报告
华泰联合证券有限责任公司关于北京海天瑞声科技股份有限公司
2024年年度持续督导跟踪报告保荐机构名称:华泰联合证券有限责任公司 被保荐公司简称:海天瑞声保荐代表人姓名:张鹏 联系电话:010-56839490保荐代表人姓名:葛青 联系电话:010-56839490根据《证券法》《证券发行上市保荐业务管理办法》《上海证券交易所科创板股票上市规则》等有关法律、法规的规定,华泰联合证券有限责任公司(以下简称“华泰联合证券”或“保荐机构”)作为北京海天瑞声科技股份有限公司(以下简称“海天瑞声”、“公司”或“发行人”)首次公开发行股票的保荐机构,对海天瑞声进行持续督导,并出具本持续督导跟踪报告。
一、保荐机构和保荐代表人发现的问题及整改情况
无。
二、重大风险事项
公司目前面临的风险因素主要如下:
(一)核心竞争力风险
1、核心技术快速迭代的风险
由于人工智能行业整体发展较为迅速,应用领域和应用场景不断拓展,下游需求随着行业发展不断发生变化,公司进行数据开发所需的各项技术也面临着快速迭代更新的风险。如果公司无法保持对行业发展趋势的洞察能力以及对研发人才的有效组织和研发经费的经济投入,则可能导致公司在行业技术快速迭代过程中无法持续保持技术先进性和技术优势,进而对公司的客户拓展、产品创新和经营业绩造成不利影响。
2、核心技术人员流失风险
随着行业的持续发展,行业内企业之间对于高端人才的竞争日益激烈,如果
公司无法持续加强核心技术人员的培养及引进并为核心技术人员提供有竞争力的激励机制和薪资待遇,则将存在核心技术人员流失的风险,公司的技术水平、研发能力也将受到不利影响。
3、核心技术失密风险
公司的数据产品和服务均以核心技术为基础。公司制定了严格的保密制度并严格执行,但上述措施仍无法完全避免公司核心技术的失密风险。如果公司相关核心技术的内控和保密机制不能得到有效执行,则可能导致公司核心技术失密的风险。
4、训练数据标准化产品无法实现授权销售的风险
公司根据对算法模型应用领域、行业发展趋势、市场需求等的评估和研判,自行设计并开发多种训练数据集标准化产品,开发完成后根据客户实际需求进行销售,授权给客户使用。在该种业务类型下,公司开发训练数据集产品,承担开发费用,并拥有训练数据集产品的知识产权。如果公司开发的训练数据集产品不能满足下游客户对训练数据的要求,则可能存在无法实现授权销售的风险,进而对公司未来的经营业绩产生不利影响。
5、数据安全相关风险
公司主要从事训练数据的研发设计、生产及销售业务,所提供的产品和服务主要以数据的形式体现。一方面,随着公司业务的快速发展和规模的持续扩张,原料数据采集与数据加工的数量持续增长;另外一方面,包括《数据安全法》、《个人信息保护法》、《生成式人工智能服务管理暂行办法》、《网络数据安全管理条例》等在内的与数据安全、个人信息保护相关的法律规章体系正逐步完善。公司如果未能按照法律规章或客户的更新要求及时调整现行业务开展方式、公司的数据安全管理体系研发升级未能跟上业务发展的需要、或客户未能遵守训练数据产品保护相关商业约定,则公司可能产生诉讼纠纷或面临生产经营不符合法律规章的要求、训练数据产品被泄露、盗版等数据安全相关风险。
同时,《数据出境安全评估办法》、《促进和规范数据跨境流动规定》等法律法规加强了对境内收集或产生的个人信息数据的跨境行为的规制。如果将来公
司未能根据相关要求及时履行相应的程序,公司开展的属于该办法限定范围内的境外业务将受到一定程度的影响。
(二)经营风险
1、收入主要来自老客户,新客户收入占比较低的风险
报告期内,公司收入主要来自老客户,占比达到85.24%,新客户收入占比较低。公司正致力于维护老客户、拓展新客户,若老客户降低对公司产品、服务的采购量或公司未能维持与老客户的合作关系,则公司的经营情况将受到不利影响;若新客户拓展情况不达预期,则公司的经营情况也将受到不利影响。
2、新业务拓展风险
随着人工智能行业持续快速地增长,下游客户对高质量、结构化、大规模训练数据的需求将持续增加。公司能否紧跟下游需求变化,加深对下游行业基础技术的理解并开发出更多的业务机会,一方面受到行业发展状况、市场需求变化以及市场竞争状况等因素影响,另一方面也取决于公司对于下游众多新领域新场景的理解认知以及合作拓展能力等诸多因素。因此,公司新业务的开拓可能不及预期或者遇到其他不利因素,进而对公司未来的经营业绩产生不利影响。
3、采购成本上升风险
报告期内,公司进行采购原料数据采集、标注所支付的数据服务费占全年与主营业务相关的采购总额的比重较高,达到80.45%。随着城乡生活成本的持续提升,前述采购价格可能存在持续上升的趋势,若公司的技术发展带来的效率提升无法抵消前述采购成本上升的影响,可能会对公司的经营业绩带来一定不利影响。
(三)行业风险
1、市场竞争加剧的风险
公司所在的细分领域为 AI 基础数据服务领域。近年来,参与该行业的公司不断增多,由于整体行业较新,行业标准和法律监管仍处于规范阶段,因此整体行业目前处于高速发展且格局未定的状态,导致市场竞争加剧。公司如果不能持
续有效地制定并实施业务发展规划,则将受到竞争者的挑战,从而面临市场竞争加剧而导致的经营状况下滑、市场地位下降和可能失去主要客户的风险,进而影响公司的盈利能力和发展潜力。
2、业务发展受下游人工智能领域发展状况影响较大的风险
公司主要为 AI 产业链上的各类机构提供算法模型开发所需的训练数据,服务于下游人工智能行业发展。公司的经营情况、业务发展与下游人工智能领域的发展状况息息相关。若未来人工智能领域景气度下降,或因技术更迭使得对训练数据的市场需求发生变动,将对公司业绩产生较大影响。
(四)宏观环境风险
1、经营业绩受税收优惠政策影响较大的风险
报告期内,公司享受了增值税即征即退、高新技术企业和研发费用加计扣除等一系列税收优惠,经营业绩受税收优惠政策影响较大。如果未来公司所享受的税收优惠政策出现不利变化,或者公司不再符合税收优惠的条件,则公司将无法持续享受税收优惠或存在所享受的税收优惠减少的可能性,并进而对公司未来经营业绩和现金流水平造成不利影响。
2、汇率波动风险
公司作为一家面向全球的训练数据服务商,拥有数量众多的境外客户,遍布美国、韩国、日本等各地区,报告期内公司境外收入占比为 47.94%,该等收入使用外币进行结算,并受人民币汇率水平变化的影响。人民币汇率可能受到国内外政治、经济环境等因素的影响,存在波动风险,进而对公司的经营业绩产生不利影响。
3、中美贸易摩擦风险
公司产品和服务的主要出口地包括美国、日韩等国家或地区。报告期内,公司出口美国的营业收入占当期公司营业收入的比重为 32.86%。公司相关境外业务始终严格遵守中国及他国法律。但国际局势瞬息万变,近年来中美贸易摩擦不断,如果中美双方出台新的贸易保护主义措施,可能会影响美国市场相关客户将数据提供给公司用于标注,减少与公司进行训练数据方面的业务合作,公司相关
业务可能会受到约束,将会对公司的生产经营产生不利影响。
三、重大违规事项
无。
四、主要财务指标的变动原因及合理性
2024年,公司主要财务数据及指标情况如下:
单位:元 币种:人民币
2024
主要财务数据 | 年 |
2023
/2024年12月31日 | 年 |
/2023年12月31日 | 变化幅度(%) |
营业收入 237,083,030.07
170,010,956.57
39.45
归属于上市公司股东的净利润
11,336,089.30-30,385,187.56
不适用归属于上市公司股东的扣除非经常性损益的净利润
4,973,475.19-43,470,684.50
不适用经营活动产生的现金流量净额
28,733,413.17 -31,046,209.61 不适用归属于上市公司股东的净资产
743,282,633.50 782,293,983.51 -4.99总资产 808,464,516.38 824,507,109.18 -1.95
主要财务指标
2024
主要财务指标 | 年 |
2023
年 | 变化幅度( |
%
基本每股收益(元/股) 0.19 -0.50
) | |
不适用稀释每股收益(元/股) 0.19 -0.50
不适用扣除非经常性损益后的基本每股收益(元/股)
0.08
-0.72
不适用加权平均净资产收益率(
)
1.49 -3.77
增加5.26个百分点
扣除非经常性损益后的加权平均净资产收益率(%)
0.65
-5.39
增加
6.04 |
个百分点研发投入占营业收入的比例(%)
26.76
34.40
减少
7.64 |
个百分点
上述主要财务数据及财务指标的变动原因如下:
1、2024年,公司营业收入为2.37亿元,较去年同期增长39.45%,主要系
受益于大模型技术的快速发展以及应用场景不断落地,以智能终端厂商、科技互
联网公司等为代表的国内外科技巨头纷纷加大多模态数据投入以支撑其智能终端、内容生成等领域的AI能力建设所致。在此背景下,以多语种、多音色等为代表的智能语音业务需求、以及以指令微调、偏好对齐等为代表的自然语言业务需求同比均呈现大幅增长,整体上驱动公司营业收入同比显著增加。
2、2024年,归属于上市公司股东的净利润、归属于上市公司股东的扣除非
经常性损益的净利润分别为1,133.61万元、497.35万元,较去年同期增加4,172.13万元、4,844.42万元,主要系营业收入大幅增长的同时,具有高毛利特点的数据集产品收入占比以及定制服务毛利率提升,驱动公司整体毛利率增加所致。此外,应收账款减值减少导致信用减值损失同比下降。以上因素共同驱动2024年度归属于母公司所有者的净利润、归属于母公司所有者的扣除非经常性损益的净利润由亏转盈,同比实现显著增长。
3、2024年,经营活动产生的现金流量净额为2,873.34万元,较去年同期增
加5,977.96万元,主要系公司2024年收入整体增长较为明显、客户回款同比增加所致。
4、2024年,基本每股收益、稀释每股收益均为0.19元/股,较去年同期增加
0.69元/股,主要系归属于母公司所有者的净利润相比同期大幅增长所致。
5、2024年,扣除非经常性损益后的基本每股收益为0.08元/股,较去年同
期增加0.80元/股,主要系归属于上市公司股东的扣除非经常性损益的净利润相比同期大幅增加所致。
五、核心竞争力的变化情况
(一)研发优势
公司拥有同行业具有竞争力的综合研发实力,截至2024年12月31日,公司研发团队规模为79人,研发能力全面覆盖平台工具开发、算法研究、产品设计等多条主线。公司核心研发人员均曾服务于全球顶尖科技企业或毕业于名校,组成了公司坚实的研发领导核心力量。同时,多年来,公司积累了较为完备的综合性、一体化数据处理平台及工具体系,覆盖智能语音、计算机视觉、自然语言等全业态领域,可服务于市面上绝大多数数据处理场景需求,包括但不限于智能驾驶、
智能家居、个人助手、内容生成等。公司还设置了专门的产品研发部门及AI+研发部门,可前瞻性挖掘和布局新兴市场需求,抢占市场先机。此外,基于公司在训练数据领域多年积累下的大量、多元化数据以及数据处理经验,通过算法平台团队与数据业务团队无缝衔接,公司可更好完成预识别算法性能提升,实现少量数据注入->算法训练->标注员反馈->模型生成->处理大量数据的自闭环体系,助力公司做大规模、提升效率、降低成本。同时,20年数据行业的从业经验积累,使得公司具备较强的数据生产工程化能力,可助力公司大幅缩短数据研发及生产周期,为公司抢占市场提供了有力支撑。上述因素共同驱动公司构建较高的行业技术壁垒。
(二)产品优势
通常来说,标准化数据集产品具有可即时获取、价格相对优惠等特点,因此市场需求旺盛。但由于标准化数据集产品是先于客户需求形成,需要数据服务商具备较强的市场趋势前瞻能力、以及财务实力进行提前投入,因此行业中具备标准化数据集产品规模化生产能力的服务商较为有限,该方向具备较高竞争壁垒。对于公司而言,标准化训练数据集产品的知识产权由公司享有,具有一次性研发生产、可重复多次销售的特点,可显著助力公司毛利水平提升,实现训练数据产品的规模化效应,因此也是公司区别于众多竞争对手的一个优势亮点。
公司基于20年数据服务经验、以及对客户需求的深刻理解,持续开拓标准化数据集,自有知识产权的训练数据产品储备超过1,700个,全面覆盖智能语音、计算机视觉、自然语言等多条业务线。
(三)语音语言学能力优势
随着境外客户全球化扩张以及境内客户出海成为新的行业发展趋势,多语种能力成为数据服务领域的核心竞争力之一,而语音语言学储备则是实现多语种拓展的重要前提。经过多年积累,公司已沉淀下深厚的语音语言学基础研究成果,并已将其运用至构建高质量的智能语音、以及多模态训练数据。在语音语言学基础研究领域,公司拥有丰富的多语种语言学家团队资源积累和多语种发音词典积累,以及不断创新的发音词典构建技术和流程技术。截止报告期末,公司已经拥
有超过205个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种、中东欧小语种的服务上具备竞争优势。同时,公司已积累下近140个多语种的发音词典,覆盖波斯尼亚语、塞尔维亚语、巽他语、尼泊尔语、奥利亚语、基隆迪语、茨瓦纳语、达利语等小语种,累计词条数超过1,200万条,可支撑构建高质量的智能语音、以及多模态训练数据,是公司的主要竞争壁垒及核心技术之一。
(四)数据安全及合规能力优势
海天瑞声自成立之初即把数据安全、数据合规视为生命线,公司在多年的数据风险识别和管理实践中,已经形成了较为成熟的安全、合规管理体系。资质方面,公司拥有ISO27001信息安全管理体系认证、ISO27701隐私信息管理体系认证、国家信息系统安全等级保护三级备案、北京市规划和自然资源委员会行政许可乙级测绘资质等。行业参与方面,公司入选中共中央网络安全和信息化委员会办公室“人工智能企业典型应用案例”,相关业务和数据安全实践受到《人民日报》等权威媒体报道和关注。公司为中国信通院数据安全推进计划成员单位,董事兼总经理李科连续入选该计划数安智库专家,其所参与、领导的公司数据安全工作,受到《北京日报》等权威媒体报道。此外,公司积极参与行业发展,入选国家标准《信息技术人工智能术语》核心参编单位、《人工智能数据标注平台技术要求和测试方法》核心参编单位,数据安全能力获得认可并产生广泛、积极的行业影响。综上所述,本报告期公司核心竞争力未发生重大不利变化。
六、研发支出变化及研发进展
单位:元 币种:人民币 2024
2023
年 | 年 |
(%)费用化研发投入 63,439,063.17 58,490,890.7 8.46资本化研发投入 - - -研发投入合计 63,439,063.17 58,490,890.7 8.46研发投入总额占营业收入比例(
变化幅度%
)
26.76
34.40
减少7.64个百分点研发投入资本化的比重(%) - - -
2024年,公司研发投入合计6,343.91万元,较去年同期增加8.46%,主要原因系2024年公司持续保持有竞争力的研发投入强度,不断提升技术和平台工具先进性、在大模型数据处理技术方向进行积极探索储备、巩固标准化数据集产品储备、增厚语音语言学基础研究领先性,持续巩固公司核心竞争力。
2024年,公司新申请发明专利5项并均获受理,获得发行专利授权4项;新申请软件著作权8项并均获受理,获得登记的软件著作权7项。截至2024年末,公司共获得专利授权41项,获得登记的软件著作权180项。
七、新增业务进展是否与前期信息披露一致
不适用。
八、募集资金的使用情况及是否合规
经中国证券监督管理委员会于2021年7月13日出具《关于同意北京海天瑞声科技股份有限公司首次公开发行股票注册的批复》(证监许可〔2021〕2366号),同意公司首次公开发行股票的注册申请,并经上海证券交易所同意,公司首次向社会公众公开发行人民币普通股1,070万股,发行价格为36.94元/股,募集资金总额为人民币395,258,000.00元,扣除各项发行费用人民币58,901,108.97元后,实际募集资金净额为人民币336,356,891.03元。上述募集资金已全部到账并经上会会计师事务所(特殊普通合伙)审验出具“上会师报字(2021)第8543号”《验资报告》。
截至2023年12月31日,首次公开发行募集资金投资项目已经结项,募集资金投资项目节余资金已经永久补充流动资金,公司募集资金专用账户余额为0,故2024年度不涉及募集资金的使用。
九、控股股东、实际控制人、董事、监事和高级管理人员的持股、
质押、冻结及减持情况
报告期内,公司董事、监事、高级管理人员直接持有公司股份的持股、质押、冻结及减持情况如下:
单位:股
姓名 | 职务 |
期初直接持股数 | 期末直接持股数 |
报告期内股份增减变动量 | 增减变动原因 |
贺琳
董事长
12,137,615 12,137,615 - -王晓东
(离任)
总经理
29,261 29,261 - -李科
董事、总经理、核心技术人员
55,262 41,447 -13,815
二级市场减
持
吕思遥
董事、副总经理、财务负责人
43,350 32,513 -10,837
二级市场减持
黄宇凯
董事、副总经理、技术总监、
核心技术人员
48,450 40,450 -8,000
二级市场减
持
贾琦
董事
0 0 - -耿学锋
(离任)
董事
0 0 - -曹文
董事
0 | 0 |
秦勇
独立董事
0 0 - -杨华
(离任)
独立董事
0 0 - -杨柳
独立董事
0 | 0 |
张蔷薇
(离任)
独立董事
0 0 - -任凌玉
独立董事
0 | 0 |
张小龙
监事会主席
0 | 0 | - | - |
许洁萍
(离任)
监事
0 0 - -沈月波
监事
0 0李娴
职工监事
0 | 0 | - | - |
郝玉峰
副总经理、技术总监、核心技
术人员
2,570 1,928 -642
二级市场减
持
张哲
董事会秘书
10,474 10,474 - -
截至2024年12月31日,根据公司提供的说明及于中国证券登记结算有限责任公司查询的股份质押冻结明细表,公司控股股东、实际控制人、董事、监事及高级管理人员持有的公司股份不存在质押、冻结的情况。
十、上海证券交易所或保荐机构认为应当发表意见的其他事项
无。
(以下无正文)