经营分析☆ ◇688787 海天瑞声 更新日期:2025-05-03◇ 通达信沪深京F10
★本栏包括【1.主营业务】【2.主营构成分析】【3.前5名客户营业收入表】【4.前5名供应商采购表】
【5.经营情况评述】
【1.主营业务】
训练数据的研发设计、生产及销售。
【2.主营构成分析】
截止日期:2024-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
软件和信息技术服务业(行业) 2.37亿 100.00 1.58亿 100.00 66.46
─────────────────────────────────────────────────
智能语音(产品) 1.65亿 69.43 1.25亿 79.53 76.13
计算机视觉(产品) 4654.63万 19.63 1761.45万 11.18 37.84
自然语言(产品) 2408.39万 10.16 1430.57万 9.08 59.40
训练数据相关的应用服务(产品) 185.43万 0.78 33.93万 0.22 18.30
─────────────────────────────────────────────────
境内(地区) 1.23亿 52.06 6703.03万 42.54 54.30
境外(地区) 1.14亿 47.94 9053.61万 57.46 79.66
─────────────────────────────────────────────────
训练数据定制服务(业务) 1.24亿 52.49 4694.79万 29.80 37.73
训练数据产品(业务) 1.11亿 46.73 1.10亿 69.99 99.54
训练数据相关的应用服务(业务) 185.43万 0.78 33.93万 0.22 18.30
─────────────────────────────────────────────────
直销(销售模式) 2.37亿 100.00 1.58亿 100.00 66.46
─────────────────────────────────────────────────
截止日期:2024-06-30
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
软件和信息技术服务(行业) 9242.64万 100.00 6501.01万 100.00 70.34
─────────────────────────────────────────────────
智能语音(产品) 6486.76万 70.18 5083.43万 78.19 78.37
计算机视觉(产品) 1670.54万 18.07 699.79万 10.76 41.89
自然语言(产品) 1084.43万 11.73 717.74万 11.04 66.19
应用服务(产品) 9056.60 0.01 475.29 0.00 5.25
─────────────────────────────────────────────────
境内(地区) 4873.11万 52.72 2794.61万 42.99 57.35
境外(地区) 4369.53万 47.28 3706.40万 57.01 84.82
─────────────────────────────────────────────────
训练数据定制服务(业务) 4655.76万 50.37 1938.22万 29.81 41.63
训练数据产品(业务) 4585.97万 49.62 4562.74万 70.19 99.49
训练数据相关的应用服务(业务) 9056.60 0.01 475.29 0.00 5.25
─────────────────────────────────────────────────
截止日期:2023-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
软件和信息技术服务业(行业) 1.70亿 100.00 9521.96万 100.00 56.01
─────────────────────────────────────────────────
智能语音(产品) 1.03亿 60.44 6515.03万 68.42 63.41
计算机视觉(产品) 4682.79万 27.54 2013.48万 21.15 43.00
自然语言(产品) 1517.06万 8.92 875.89万 9.20 57.74
训练数据相关的应用服务(产品) 525.99万 3.09 117.55万 1.23 22.35
─────────────────────────────────────────────────
境内(地区) 1.10亿 64.73 4896.21万 51.42 44.49
境外(地区) 5996.15万 35.27 4625.75万 48.58 77.15
─────────────────────────────────────────────────
训练数据定制服务(业务) 9901.55万 58.24 2848.49万 29.91 28.77
训练数据产品(业务) 6573.55万 38.67 6555.92万 68.85 99.73
训练数据相关的应用服务(业务) 525.99万 3.09 117.55万 1.23 22.35
─────────────────────────────────────────────────
直销(销售模式) 1.70亿 100.00 9521.96万 100.00 56.01
─────────────────────────────────────────────────
截止日期:2023-06-30
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
软件和信息技术服务(行业) 7446.09万 100.00 4382.06万 100.00 58.85
─────────────────────────────────────────────────
智能语音(产品) 4734.39万 63.58 --- --- ---
计算机视觉(产品) 1929.63万 25.91 --- --- ---
自然语言(产品) 779.26万 10.47 --- --- ---
应用服务(产品) 2.81万 0.04 --- --- ---
─────────────────────────────────────────────────
境内(地区) 4533.01万 60.88 --- --- ---
境外(地区) 2913.08万 39.12 --- --- ---
─────────────────────────────────────────────────
训练数据定制服务(业务) 4618.70万 62.03 --- --- ---
训练数据产品(业务) 2824.58万 37.93 --- --- ---
训练数据相关的应用服务(业务) 2.81万 0.04 --- --- ---
─────────────────────────────────────────────────
【3.前5名客户营业收入表】
截止日期:2024-12-31
前5大客户共销售1.03亿元,占营业收入的43.59%
┌───────────────────────┬───────────┬───────────┐
│客户名称 │ 营收额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│客户1 │ 5253.35│ 22.16│
│客户2 │ 1361.23│ 5.74│
│客户3 │ 1331.23│ 5.62│
│客户4 │ 1223.96│ 5.16│
│客户5 │ 1163.32│ 4.91│
│合计 │ 10333.09│ 43.59│
└───────────────────────┴───────────┴───────────┘
【4.前5名供应商采购表】
截止日期:2024-12-31
前5大供应商共采购0.41亿元,占总采购额的36.67%
┌───────────────────────┬───────────┬───────────┐
│供应商名称 │ 采购额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│供应商1 │ 1282.80│ 11.54│
│供应商2 │ 847.27│ 7.62│
│供应商3 │ 780.58│ 7.02│
│供应商4 │ 681.60│ 6.13│
│供应商5 │ 484.91│ 4.36│
│合计 │ 4077.16│ 36.67│
└───────────────────────┴───────────┴───────────┘
【5.经营情况评述】
截止日期:2024-12-31
●发展回顾:
一、经营情况讨论与分析
2024年,受益于多模态大模型的快速发展以及“AI+”在应用端的进一步落地,全球训练数据需求快速
增长。一方面,大模型语音交互需求持续攀升,公司凭借多年在语音数据方面的积累,获得以智能终端厂商
、科技互联网公司等为代表的国内外科技巨头多类语音数据订单,带动大模型相关业务收入快速增加,并成
为公司收入增长的核心引擎。另一方面,为更好拥抱新一轮全球化市场机遇,公司持续加大海外市场拓展力
度,丰富品牌营销策略、推动销售提速,并通过建设海外交付能力完善海外供应链体系,启动海外全链条服
务能力的延展,进一步带动境外业务收入显著复苏。此外,公司不断拓展智能驾驶服务能力边界,抢抓车企
出海机遇,积极探索布局境外数据采集业务;同时继续保持有竞争力的研发投入,持续优化迭代智能驾驶数
据处理相关算法研发和平台建设,以及智能化标注能力数据服务能力逐步延伸至4D数据标注、大点云分割等
更复杂场景,以更好适应以BEV技术为主、稳步向OCC技术方向探索的高阶智能驾驶技术需求。受上述各项积
极因素带动,公司整体营业收入实现同比增长。
此外,由于标准化数据集产品收入占比大幅提升,同时公司整体数据交付能力在管理能力优化、平台技
术提升、供应链进一步整合和扩展等因素的共同推动下,使训练数据定制服务的毛利率也同比显著增长,共
同驱动公司整体毛利率增加至66.46%。此外,应收账款减值减少导致信用减值损失同比下降。以上因素共同
驱动公司全年净利润大幅增长,实现扭亏为盈。
报告期内,公司实现营业收入2.37亿元,较上年同期增长39.45%;归属于母公司所有者的净利润1,133.
61万元,较上年同期增加4,172.13万元;归属于母公司所有者的扣除非经常性损益的净利润为497.35万元,
较上年同期增加4,844.42万元;经营性现金流净额2,873.34万元,较上年同期增加5,977.96万元。截至报告
期末,公司总资产为8.08亿元,归属于母公司的所有者权益为7.43亿元,分别较期初减少1.95%和4.99%。20
24年公司具体经营情况如下:
(一)核心业务板块经营情况
1.训练数据全球化业务
2024年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷
加大多模态数据投入,全球数据服务市场持续增长。在此背景下,公司凭借多年在语言研究方面的技术积累
、以及全球领先的标准化数据集产品储备,进一步赢得了境外客户信赖。与此同时,《促进和规范数据跨境
流动规定》等法规出台,为数据出境提供了更为高效简明的路径。得益于行业发展以及政策环境的改善,截
至报告期末,公司境外业务收入较上年同期显著增长89.53%至1.14亿元。
此外,为更好把握行业机遇、进一步扩大全球客户辐射范围,公司从体系搭建、市场研究、品牌升级、
营销推广等多维度提升业务、客户触达及服务能力。报告期内,公司持续加强境外销售团队建设,进一步织
密客户服务网络;同时,通过参与包括WebSummitQatar、ICASSP、AIEXPOTOKYO、AutosenseandInCabin、CV
PR、ACL、Interspeech、SLT及NeurlPS等全球知名行业及AI学术顶会,以及布局搜索广告投放、社交媒体矩
阵等多类宣传渠道等方式,向全球市场展示公司先进技术实力及创新产品,提升行业影响力和美誉度。2024
年公司获得由AcquisitionInternationalMagazine颁发的"BestAI-PoweredDataSolutionsCompany"奖项和Da
tarade颁发的"TopAITrainingDataProvider"奖项。截至报告期末,公司境外客户数量已超过260家。
报告期内,公司通过在新加坡投资设立控股公司的方式拓展海外首个自主可控的数据交付基地,在订单
、产能两端同步实现增量覆盖,不仅有助于培育新的营收增长点,更为下一步提升海外定制化业务能力奠定
基础。
2.大模型数据服务业务
伴随大模型技术的不断突破,人工智能行业被按下发展“快进键”,数据作为大模型的“燃料”,已成
为模型公司打造差异化优势的战略性资源,高质量数据需求快速增加。报告期内,公司不断拓展自身大模型
数据服务能力,从预训练、后训练、到指令微调、对齐、评测等全链条环节为客户提供立体支撑;同时,也
逐渐从通用的基座模型的数据服务,拓展至艺术、工业、教育、医疗等多类垂直领域;服务的客户范围也已
覆盖至主要大模型厂商和研究机构。报告期内,公司持续加大大模型数据方向的研发投入,增厚大模型领域
的数据储备,新增开发了多类多语种、多音色、多情感、多场景的ASR和TTS语音数据集;以及服务视觉理解
以及视觉生成的视觉数据集;同时,前瞻性建设了用于提升大模型推理能力的CoT数据集,通过详细的推理
步骤注释,让大模型学习从问题到答案的逻辑推导过程,有效填补传统数据集缺乏推理结构的空白。与此同
时,为更好理解大模型技术方向,报告期内,公司通过前瞻性研究,探索大模型数据的规模化生产方式,全
面助力公司大模型业务的扩张。公司已和清华大学联合启动多语种语音大模型研发计划,该项目将基于最新
的E-Branchformer、CTC-Attention技术,自研东方40语种、以及中国22方言数据清洗技术,训练了0.1B-1.
7B等4个不同规模的语音大模型,模型效果达到了业界同等尺寸的领先水平。公司的算法团队联合清华大学
语音与音频技术实验室充分利用公司海量高质量语音数据集储备,充分发挥各自所长,促进大模型技术在数
据生产领域的更深层次的应用。
3.智能驾驶行业数据服务业务
2024年,为更好抢抓智能驾驶行业机遇,同时应对更为复杂的数据处理需求,公司加大了对高级别数据
标注工具的研发力度,截至报告期末,DOTS-AD平台新增3D动静分离标注工具,BEV多图层4D车道线标注工具
,并升级点云分割工具支持连续帧叠加标注和大点云分段加载、点云区域分割等核心能力,有效支撑了自动
驾驶BEV和OCC主流算法演进对数据标注工具的需求。此外,公司不断优化算法中台中枢能力,开发了2D&3D
融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效30%以上;迭代优化点云分割算法和地面检
测算法,在点云分割产线实现提效20%以上;研发3D点云预刷式跟踪技术、4D点云重建技术,均取得了20%以
上的提效成果。
此外,为进一步支撑我国车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集
方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。截至报告期末,公
司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基
础。同时,舱内支撑DMS和OMS研发需求的采集业务也已拓展至俄罗斯、奥地利等多个欧洲国家,为众多客户
出海业务提供有力数据支持。
(二)核心技术能力建设情况
2024年,按照技术+产品双轮驱动的定位,公司继续保持有竞争力的研发投入强度,不断提升技术和平
台工具先进性、在大模型数据处理技术方向进行积极探索储备、巩固标准化数据集产品储备、增厚语音语言
学基础研究领先性,持续巩固公司核心竞争力。报告期内,公司研发费用共计6,343.91万元,占当期营业收
入的26.76%。截至报告期末,公司研发人员数量79人。
1.算法及平台能力建设、大模型数据处理技术持续探索储备
报告期内,公司持续加大基础研发投入,进一步提升人工智能基础算法、一体化数据处理平台、前沿技
术研发等领域能力;在智能驾驶数据处理综合性平台上继续提升自动化能力,并落地更多面向智能驾驶数据
预处理的相关算法;同时,在面向大模型预训练、后训练、微调、对齐及评测技术上持续保持技术探索、储
备,推动相关领域的数据服务,并形成了一些代表性成果:
1.1算法
智能语音领域,完成Whisper推理框架升级、显存占用降低59%、推理延迟降低59%,新增ASR模型11个、
语音识别算法支持语种数增至130+个,大幅提升了算法在实际项目中的降本增效能力。在计算机视觉领域,
引入Detzero-track、CenterPoint、Lane-Marking-Detection、FaceFusion、roop、Ultralytics、BoT-SOR
T等有代表性的计算机视觉框架或算法,上线3D点云目标检测多模型融合算法、4D大点云车道线检测算法、G
DINO-零样本目标检测等算法,优化2D细分类视频跟踪算法、2D异形红绿灯跟踪算法、4D车道线长度动态自
适应调整算法等多个智能驾驶场景下的模型,并新增超过27种不同场景的视觉类算法预处理技术。在大模型
算法领域,针对公司自有知识产权的语音数据集,设计通用的数据清洗、模型训练、模型评测框架,已完成
数据清洗pipeline搭建,并初步清洗出通用格式的语音数据数十万小时,同时完成语音大模型训练所需要的
算力集群搭建、算法框架研发、模型训练pipeline搭建、并完成东方语种语音大模型的训练、微调、评测等
。针对视觉大模型应用领域,构建起基于特征向量的去重技术、美学评分模型、图文生成模型等多个基础能
力,并在项目中投入应用,取得了良好的降本效果。
1.2平台
公司在训练数据生产与管理的一体化平台建设方向精耕细作,展现了一系列创新成果,具体可归结为以
下核心维度:
(1)重点推进以数据为核心的一体化平台体系建设,通过集中研发DataX数据中台,优化整合原有数据
存储、数据可视化和数据流转等功能,全面提升一体化数据处理平台的处理过程柔性管理能力,数据处理管
道新增可视化编排工具,集成20+新型算子,实现了十余类核心预处理算法模型自动化对接、数据切片、数
据加工处理管道的快速搭建与灵活编排,以及数据处理算子集成与统一管理,共计近60个功能点。
(2)实现贯穿数据采标、模型训练、模型效果展示全生命周期管理:重点优化多源多模态非结构化与
结构化数据的标准化与一致性管理,以及点云与图像类算法模型对比与模型评测支撑能力。深度集成预处理
算法库,算法评测体系扩展至15+量化指标,支持多模型对比测试与算法结果可视化展示,扩展模型版本效
果量化对比展示及分析能力等超60个功能点,大幅提升公司对训练数据的一站式全生命周期管理能力,形成
从数据管理到模型迭代的完整算法增强闭环。
(3)积极投入人工智能数据运营平台的全链路智能化体系革新,重点建设数据共建共享机制、全面升
级多模态AI标注算法矩阵、有效优化分级流通合规保障体系等核心功能,创新研发自动化标注工具集群,搭
建覆盖开源开放、成员共建、可信空间的三级数据生态,形成覆盖文本、语音、图像、视频的智能化处理矩
阵。同时,逐步建设形成从资质认证、脱敏加密到合规审计的全流程安全管控体系,强化跨平台数据流动追
溯与多角色协同能力,构筑起集数据汇聚、生产、治理、流通、应用于一体的智能化基础设施平台,推动数
据要素市场基础设施向智能化、合规化、生态化方向加速演进。
通过上述投入,截至报告期末,公司共获得专利授权41项,获得登记的软件著作权180项。同时,公司
实质性地提升了自身的数据全生命周期管理与运营能力、算法能力、工程化数据研发及生产能力,形成了更
为合理、高效的人机协同智能化解决方案,持续降低训练数据开发成本,以AI赋能训练数据开发,以训练数
据驱动AI产业发展。
2.标准化数据集产品
标准化数据集产品,是公司区别于众多竞争对手以定制化服务为主的特有商业模式,也是公司核心竞争
力之一,标准化产品是公司基于未来行业需求的研判,在市场需求出现之前,预先开发的数据集,具有即用
即取的特点,可帮助客户大幅缩短模型研发周期并有效降低数据投入成本。同时,由于产品本身的知识产权
由公司享有,具有一次性研发生产、可重复多次销售的特点,因此可更好帮助公司实现未来可持续性销售、
以及毛利空间提升。
因此,为更好适应行业发展需求,公司2024年在产品研发方面持续投入,用于开发覆盖智能语音、计算
机视觉以及自然语言等传统深度学习以及大模型领域的相关数据集产品。截止报告期末,公司新增研发超15
0个训练数据集产品,自有知识产权的训练数据产品储备超过1,700个,尤其在多语种及多音色语音数据集和
发音词典、动作捕捉等多模态数据集、以及多语种OCR和手写体数据集等方面积累了更丰富的标准化产品资
源,并建成包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)预训练及微调数
据集”、“视觉大模型(图像-文本)预训练及微调数据集”等在内的多领域大模型数据集。
截止报告期末,公司已向下游客户提供了累计超过9,500次/个定制或标准化训练数据集,并已应用于个
人助手、语音输入、内容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交
、虚拟人、智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息
提取、情感分析、OCR识别等22类创新应用领域,赋能人工智能技术与实体经济的深度融合。
3.语音语言学能力
随着全球化扩张成为头部AI企业收入增长的重要引擎,多语种数据的作用和价值更加凸显。为更好满足
客户多语种拓展需求,公司持续保持语音语言学研究力度,在语音语言学基础研究方面,公司不断丰富合作
语言学家团队资源,成员遍布世界各地的学校及研究机构,在语音语言学领域具备丰富经验和技术储备。截
止报告期末,公司已经拥有超过205个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常
见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种、中东欧小语种的服务上具
备竞争优势。同时,公司建立了成熟的发音词典构建流程,公司已积累下近140个多语种的发音词典,覆盖
波斯尼亚语、塞尔维亚语、巽他语、尼泊尔语、奥利亚语、基隆迪语、茨瓦纳语、达利语等小语种,累计词
条数超过1,200万条,可支撑构建高质量的智能语音、以及多模态训练数据,是公司的主要竞争壁垒及核心
技术之一。
(三)其他综合能力建设情况
1.数据安全及合规
2024年,中央和地方出台了一系列有关数据要素、数字经济的法律法规和政策,同时,《促进和规范数
据跨境流动规定》等法规出台,都对企业的数据安全水准和能力提出了更高要求,也为企业在数据要素、人
工智能等领域的发展提供了新的机遇。
公司一直以来非常重视数据安全管理以及相关能力的提升,并将其作为把握新发展机遇所必须练好的“
基本功”。2024年,公司在数据安全方面取得了多项工作成果。公司“AIGC训练数据业务的综合合规管理机
制”案例荣获中国互联网协会首届“金灵光杯”中国互联网创新大赛企业合规赛道优秀奖。公司积极参与行
业发展,提出立法建议、参与行业调研,数据安全能力获得广泛认可。
公司也一直坚持统筹安全与发展并重的原则,在守住安全合规底线的前提下积极拓展包括数据跨境流通
在内的数据要素业务。
2.供应链体系
2024年,在AI大模型技术快速迭代的驱动下,公司战略布局医疗、金融、法律、艺术等垂直领域,深度
整合产学研资源,通过与各行业的专业机构及专家的合作成功构建了覆盖诊断、智能投顾、合规风控、数字
版权等细分场景的供应链资源池,不仅提升了供应链体系的响应敏捷度与行业适配性,更通过知识图谱与区
块链技术的融合应用,实现了跨领域资源的智能匹配与全流程可信溯源,显著增强了供应链生态的多样性与
专业壁垒。
在战略供应商生态构建方面,公司深度践行“共生共赢”理念,与战略供应商建立了长期稳定的合作关
系,加强了与供应商的风险共担机制,共同应对市场波动和不确定性。
公司也进一步优化了供应链网络,特别是在海外一手资源群体的扩展方面取得了重要进展。通过建设大
型数据基地及精细化管理资源池,供应链的多样性和稳定性得到了显著提升,为实现可持续性产能扩张和成
本优化奠定了坚实基础。
在供应链管理体系建设方面,通过建立更细致的成本核算模型和流程监控节点,实现了对供应链各环节
成本和效率的精准把控。同时,全面升级线上管理系统,实现了订单处理、资源配置和结算审批的一体化和
实时化。
3.人力资源
报告期内,公司完成销售、生产、研发体系的绩效管理机制优化,并对内部反馈机制及奖金核算机制进
行迭代,以期增强绩效牵引力实现更加公平和富于激励性的管理效果。上半年公司组织多种类专项培训及人
才发展项目,在大模型领域的探索与应用进行广泛深入的内部交流,组织销售、生产、职能等多体系的软技
能培训,对应届高潜毕业生、新锐力量、中坚力量、中高层管理人员采取不同的梯队建设规划,以保障人才
队伍的不断夯实。文化建设方面,强化高度敬业和持续创新文化,进行榜样之星等多样化的文化倡导和活动
辐射,打造更加尊重信赖和追求卓越的组织基因。同时在人才引进方面,启动海外人才招募、研发专项人才
和高潜毕业生吸引计划,引入多名欧美同业专家、优质研发人员、及卓越背景应届毕业生,充实销售、研发
及项目交付队伍的人才密度,发展健康、可持续、多元化的人才队伍。
二、报告期内公司所从事的主要业务、经营模式、行业情况及研发情况说明
(一)主要业务、主要产品或服务情况
1.主要业务情况
公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对
取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。
自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集
。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标
准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据涵盖智能语音(语音识别、语音合成
等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能家居、智能驾驶、智慧金融、智
能安防等多种创新应用场景。
公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三
星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、内容生
成、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前公司客
户累计数量超过1,050家,覆盖了科技互联网、社交、IoT、智能驾驶、大模型等领域的主流企业,以及政企
、教育科研机构。
2.主要产品及服务情况
2.1主要产品及服务按业务类型分类
公司研发、生产的训练数据覆盖了智能语音、计算机视觉及自然语言处理三大AI核心领域,广泛应用于
算法模型的开发、训练、优化、应用场景拓展等环节。此外,公司还提供与训练数据相关的应用服务。
(1)智能语音
人工智能在语音领域的应用技术主要包括语音识别、语音合成等。
语音识别(AutomaticSpeechRecognition,ASR)是让机器能够“听懂”人类语音的技术,它能使机器
自动将语音信号转换为对应的文本信息。
语音合成(TexttoSpeech,TTS)是让机器能够“说出”人类语音的技术,它使机器能将文字信息转化
为流畅的语音“朗读”出来,相当于给机器安上了人工嘴巴。
以日常生活中的情景为例,语音输入法、即时通讯软件运用了语音识别技术将用户输入的语音实时转换
为文字,实现了软件“听懂”语音并“听写”出文字的效果;而地图、导航软件则运用语音合成技术,实现
了软件“发声说话”的效果,为用户提供即时语音导航。
公司通过设计(设计训练数据集结构、供发音人朗读录制的语料文本或对话场景、发音人分布、录音设
备场景等)、采集(定义合适的发音人、选取录音设备及软件、组织发音人朗读录制音频)、加工(对音频
文件进行切分、标注各类声音特征,形成带时间戳和特征标签的文本和标注文件等)、质检(对数据集进行
质量检测,如音字一致性、标注准确率检查等)等训练数据集生产环节;或者针对客户提供的原料音频文件
执行加工、质检工作,最终形成客户所需的智能语音训练数据集。
(2)计算机视觉
计算机视觉(ComputerVision,CV)是使机器具备“看”的功能的技术,它使得智能驾驶、智能家居、
手机、安防设备等机器能够代替人眼对目标进行识别、跟踪和测量等。
以日常生活中的情景为例,在汽车的自动驾驶功能中,计算机视觉技术使得汽车能够“看见”并识别行
车过程中的各种行人、路况场景,为后续作出相应的反应奠定基础;在机场、车站安检中,计算机视觉技术
使得人脸识别设备能够识别被检验人员是否为其出示的身份证件显示的人员。
公司通过设计训练数据集结构、采集(如定义合适的人脸、动作、场景作为采集对象,组织被采集人按
照要求拍摄照片、录制视频等)、加工(对图像、视频文件进行打点、拉框、分割标注等)、质检(对数据
集进行质量检测,如检验图片、视频文件格式是否正确,检查光照环境、物体种类的数量是否达标,打点标
框的准确率是否符合要求等);或者对客户提供的图像、视频文件执行加工、质检工作,最终形成客户所需
的计算机视觉训练数据集。
(3)自然语言处理
自然语言处理(NaturalLanguageProcessing,NLP)是使机器能够像人一样理解语言意图的技术。
以日常生活中的情景为例,寄送快递时使用的“智能填写”功能即运用了自然语言处理技术,在输入框
中填入整段联系信息,软件应用能够理解语义,并从中识别及提取“收件人”、“联系方式”、“地址信息
”等所需信息,完成自动填写;智能客服、聊天机器人等人机交互程序也运用了自然语言处理技术,使得程
序、机器能够读懂人类语言的真正意图,并相应做出反应、提供服务等。
公司通过设计训练数据集结构、采集(收集或编写自然语言文本、对话等数据信息)、加工(对自然语
言文本数据进行单词分割、词性标注、语义语法标注、情感属性标注等)、质检(对数据集进行质量检测,
如检验文
|