chaguwang.cn-查股网.中国

查股网.CN

 

海天瑞声(688787)经营分析主营业务

 

查询个股经营分析(输入股票代码):

经营分析☆ ◇688787 海天瑞声 更新日期:2024-04-27◇ 通达信沪深京F10 ★本栏包括【1.主营业务】【2.主营构成分析】【3.前5名客户营业收入表】【4.前5名供应商采购表】 【5.经营情况评述】 【1.主营业务】 训练数据的研发设计、生产及销售。 【2.主营构成分析】 截止日期:2023-06-30 项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%) ─────────────────────────────────────────────── 软件和信息技术服务(行业) 7446.09万 100.00 4382.06万 100.00 58.85 ─────────────────────────────────────────────── 智能语音(产品) 4734.39万 63.58 --- --- --- 计算机视觉(产品) 1929.63万 25.91 --- --- --- 自然语言(产品) 779.26万 10.47 --- --- --- 应用服务(产品) 2.81万 0.04 --- --- --- ─────────────────────────────────────────────── 境内(地区) 4533.01万 60.88 --- --- --- 境外(地区) 2913.08万 39.12 --- --- --- ─────────────────────────────────────────────── 训练数据定制服务(业务) 4618.70万 62.03 --- --- --- 训练数据产品(业务) 2824.58万 37.93 --- --- --- 训练数据相关的应用服务(业务) 2.81万 0.04 --- --- --- ─────────────────────────────────────────────── 截止日期:2022-12-31 项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%) ─────────────────────────────────────────────── 软件和信息技术服务业(行业) 2.63亿 100.00 1.70亿 100.00 64.73 ─────────────────────────────────────────────── 智能语音(产品) 1.74亿 66.30 1.17亿 68.84 67.21 计算机视觉(产品) 6055.76万 23.04 3255.49万 19.13 53.76 自然语言(产品) 2269.41万 8.63 1636.76万 9.62 72.12 训练数据相关的应用服务(产品) 533.64万 2.03 410.34万 2.41 76.89 ─────────────────────────────────────────────── 境内(地区) 1.47亿 55.97 7314.23万 42.98 49.71 境外(地区) 1.16亿 44.03 9703.51万 57.02 83.82 ─────────────────────────────────────────────── 训练数据定制服务(业务) 1.46亿 55.70 --- --- --- 训练数据产品(业务) 1.11亿 42.27 --- --- --- 训练数据相关的应用服务(业务) 533.64万 2.03 410.34万 2.41 76.89 ─────────────────────────────────────────────── 直销(销售模式) 2.63亿 100.00 1.70亿 100.00 64.73 ─────────────────────────────────────────────── 截止日期:2022-06-30 项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%) ─────────────────────────────────────────────── 软件和信息技术服务(行业) 1.15亿 100.00 7619.70万 100.00 66.38 ─────────────────────────────────────────────── 智能语音(产品) 8183.94万 71.30 --- --- --- 计算机视觉(产品) 2116.24万 18.44 --- --- --- 自然语言(产品) 1034.44万 9.01 --- --- --- 应用服务(产品) 143.82万 1.25 --- --- --- ─────────────────────────────────────────────── 境外(地区) 6558.54万 57.14 --- --- --- 境内(地区) 4919.90万 42.86 --- --- --- ─────────────────────────────────────────────── 训练数据定制服务(业务) 5905.10万 51.45 --- --- --- 训练数据产品(业务) 5429.52万 47.30 --- --- --- 训练数据相关的应用服务(业务) 143.82万 1.25 --- --- --- ─────────────────────────────────────────────── 截止日期:2021-12-31 项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%) ─────────────────────────────────────────────── 软件和信息技术服务业(行业) 2.06亿 100.00 1.32亿 100.00 64.01 ─────────────────────────────────────────────── 智能语音(产品) 1.49亿 72.33 9739.62万 73.69 65.21 自然语言(产品) 2514.94万 12.18 1542.69万 11.67 61.34 计算机视觉(产品) 2382.68万 11.54 1320.62万 9.99 55.43 训练数据相关的应用服务(产品) 815.22万 3.95 613.53万 4.64 75.26 ─────────────────────────────────────────────── 境内(地区) 1.49亿 72.25 8466.40万 64.06 56.75 境外(地区) 5729.72万 27.75 4750.07万 35.94 82.90 ─────────────────────────────────────────────── 直销(销售模式) 2.06亿 100.00 1.32亿 100.00 64.01 ─────────────────────────────────────────────── 【3.前5名客户营业收入表】 截止日期:2023-12-31 前5大客户共销售0.57亿元,占营业收入的33.41% ┌───────────────────────┬──────────┬──────────┐ │客户名称 │ 营收额(万元)│ 占比(%)│ ├───────────────────────┼──────────┼──────────┤ │客户1 │ 1254.04│ 7.38│ │客户2 │ 1214.90│ 7.15│ │客户3 │ 1213.58│ 7.14│ │客户4 │ 1095.57│ 6.44│ │客户5 │ 901.49│ 5.30│ │合计 │ 5679.58│ 33.41│ └───────────────────────┴──────────┴──────────┘ 【4.前5名供应商采购表】 截止日期:2023-12-31 前5大供应商共采购0.32亿元,占总采购额的32.84% ┌───────────────────────┬──────────┬──────────┐ │供应商名称 │ 采购额(万元)│ 占比(%)│ ├───────────────────────┼──────────┼──────────┤ │供应商1 │ 1075.79│ 11.14│ │供应商2 │ 742.26│ 7.69│ │供应商3 │ 575.50│ 5.96│ │供应商4 │ 435.13│ 4.51│ │供应商5 │ 341.66│ 3.54│ │合计 │ 3170.34│ 32.84│ └───────────────────────┴──────────┴──────────┘ 【5.经营情况评述】 截止日期:2023-06-30 ●发展回顾: 一、报告期内公司所属行业及主营业务情况说明 (一)所属行业情况 1.行业的发展阶段、基本特点、主要技术门槛 根据国家统计局《战略性新兴产业分类(2018)》,公司所从事的训练数据生产业务属于“新一代信息 技术产业—新兴软件和新型信息技术服务—新型信息技术服务—信息处理和存储支持服务—数据加工处理服 务”行业,是国家重点支持的“新一代信息技术领域”的战略性新兴产业。公司通过设计训练数据集结构、 执行数据采集、加工处理过程,生产用于算法模型开发训练用途的专业数据集,并以软件形式向客户交付, 所属行业为软件和信息技术服务业。 1.1行业的发展阶段、基本特点 (1)在全球数字经济发展以及大模型技术的共同驱动下,全球人工智能产业进入新一轮加速 当前,新一轮科技革命和产业变革深入发展,数字化转型成为大势所趋,世界主要国家均高度重视发展 数字经济,纷纷出台战略规划,重塑数字时代的国际竞争新格局。人工智能作为数字经济发展的底层核心技 术之一,正在发挥更加重要的作用。例如,随着数字经济发展的不断深入,数据体量以及复杂度均不断提升 ,为更好解决产业数字化中数据提取、处理、分析等工作,将会产生更多样化的人工智能需求,人工智能支 出也将成为支持企业数字化转型支出的主力因素之一。 根据IDC报告,全球范围内,企业在人工智能市场的投资增速将显著高于数字化转型支出(DX)和GDP增 速。 此外,以ChatGPT为代表的大模型在近期的现象级智能化表现引发行业强烈关注。作为全新的人工智能 聊天机器人,在推出两个多月时,ChatGPT全球用户已突破1亿,人工智能通过极具颠覆性的能力再次走入大 众视野,并获得了产业界的广泛关注。可以预见,人工智能行业将在以ChatGPT为代表的大模型技术的推动 下进入新一轮产业高速发展期。 未来,受益于数字经济政策和大模型技术的双重驱动,人工智能将具备更强的产业融合能力,并将深刻 影响千行百业的运行规则,以及人们的生活方式,人工智能产业的发展将随之进入快车道。 根据国际数据公司(IDC)的数据,2021年,全球人工智能市场规模为885.7亿美元,预计2025年将达到 2218.7亿美元,年复合增长率达到26.2%。 在市场需求拉动和国家政策的支持引导下,当前我国人工智能产业加速发展,已形成基础底层设施、中 层技术以及上层应用的完备的产业链生态,一批创新活跃、特色鲜明的创新企业不断涌现,并联合推动中国 人工智能产业实现规模增长。根据艾瑞咨询的数据显示,2022年中国人工智能产业规模达1948亿元,预计20 27年市场规模将达到6122亿元,年复合增长率为25.6%,主要与智算中心建设以及大模型训练等需求拉动的A I芯片市场、无接触服务需求拉动的智能机器人及对话式AI市场等快速增长相关。有望在下游制造、交通、 金融医疗等多领域不断渗透,实现大规模落地应用。 (2)训练数据作为AI发展和演进“燃料”的作用更加凸显,并逐渐成为大模型竞赛中的重要决定因素 在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。算法模型从技术理论到应用实践 的落地过程依赖于大量的训练数据。训练数据越多、越完整、质量越高,模型推断的结论越可靠。过去十年 ,人工智能产业以算法为核心,通过深度学习算法的不断创新,推动人工智能产业的快速发展。但未来,当 算法发展趋于开源、算力能力大幅提升及人工智能模型从技术理论应用到更多的垂直场景,想要更快更好提 升人工智能能力,数据将发挥更重要的作用。 尤其在大模型时代下的今天,数据正在被视为大模型落地以及竞赛中重要的决定性要素。在大模型领域 ,过去业界普遍认为模型参数量是模型效果增强的核心要素,模型参数越大,性能表现越好,而如今这一“ 参数”定律正在打破。Meta今年开发的新模型Llama(LargeLanguageModelMetaAI)证明,相比于单纯参数 量提升,训练数据规模以及多样性的增强,可带来更好的模型效果提升。根据新浪财经报道,Llama-13B虽 然在参数规模上相较于GPT-3(175B)小了十几倍,但由于其大幅提升了训练数据规模(Llama-13B训练数据 量约为GPT-3的3倍),其表现能力在大部分指标上均超越了后者;与此同时,Llama-65B也是凭借数据规模 优势,与谷歌5400亿参数的PaLM-540B在表现上旗鼓相当。 可以看出,数据正在逐渐成为大模型时代下的重要推动力量,并产生快速增长的数据需求。根据Cognil ytica数据统计显示,2021年全球AI训练数据市场需求约为42亿美元,并预计到2027年这一需求将增长到220 亿美元,2021-2027年复合增长率达32%。 中国作为全球人工智能产业增速最快的国家之一,相关数据需求也在快速增长。根据德勤数据,2022年 中国人工智能基础数据服务市场规模为45亿元,2027年规模将达到130-160亿元,年复合增长率为23.6%-28. 9%。 (3)数据要素市场蓬勃发展,数据行业迎来更为广阔的发展机遇 近年来,我国数字经济蓬勃发展,数据要素因具有基础性战略资源和关键性生产要素的双重属性,相关 市场规模持续增长。尤其在《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》出台 后,我国系统性布局了数据基础制度体系的(“四梁八柱”,加速了数据流通交易和数据要素市场发展,进 一步推动了公共数据、企业数据、个人数据合规高效流通使用。为更好响应中央号召,北京、上海、广州、 深圳、杭州等地数据政策陆续出台,逐步构建了多层次、多元化数据要素市场生态体系。 以北京为例,《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》《北京市促进通用人 工智能创新发展的若干措施》和《关于推进北京市数据专区建设的指导意见》指出,北京市要加快建设“数 据基础制度先行先试示范区”(以下简称“先行先试示范区”),“支持北京经济技术开发区等开展数据基 础制度先行先试,打造政策高地、可信空间和数据工场”,探索打造数据训练基地,归集高质量基础训练数 据集,推动数据要素高水平开放,提升本市人工智能数据标注库规模和质量,并建设针对重大领域、重点区 域或特定场景建设专题数据区域,吸纳市场主体和数据、技术、资本等多元要素参与。北京市陆续出台的多 项文件旨在打破数据壁垒,推动数据融合利用,加快推动公共数据开放,促进数据要素流通,激发数字市场 创新活力,释放和发展数字化生产力,打造多层级数据要素市场,成为具有竞争力和影响力的数字产业集群 。按照“政府引导、市场运作、创新引领、安全可控”的原则,(“先行先试示范区”有望成为国际领先的 数据要素高效流通核心枢纽。 数据要素市场受政策推动,进入高速发展期,未来围绕数据的价值利用以及流通交易,将产生大量新增 数据需求,为数据行业开拓了新的增长空间,提供了新的业务拓展机遇。未来,数据要素也将成为数据行业 增长的重要推动力量。 (4)训练数据领域的未来发展趋势 a.大模型技术的突破和跃升,将驱动新型数据需求持续增长 随着ChatGPT成为全球范围内的现象级应用,人工智能迎来了新的发展机遇,其背后的大模型技术也将 进一步引导人工智能产业变革并带来相关数据需求的变化和增长。 首先,和传统的深度学习模型相比,大模型的数据需求规模将呈指数级增长。传统深度学习技术路线下 ,训练一个专有小模型大约需要GB级数据,而训练一个大模型通常需要TB级数据(例如,GPT-3的原始文本 语料多达45TB)。此外,大模型数据丰富程度显著增加,大模型不仅包含海量语言类、知识类信息,还包括 各类垂直领域以及多模态数据,通过多样化数据的引入,大幅提升模型的通用能力以及迁移能力,并使其可 服务更多的任务类型与场景。同时,数据质量会显著拉开大模型预训练阶段的效果差距。另外,相比于传统 模型训练,大模型的数据需求类型也将有所转变,更多模型或将采用类强化学习模式来进行特定领域或特定 方向上的优化迭代,以使得机器能够以更加接近于人类期望的方式提供答案输出。对于大模型训练而言,不 仅需要持续获取大规模、多样化(多模态、多场景、多垂向)、高质量的数据,更须具备持续迭代的高质量 数据清洗和标注策略,以不断提升包括预训练(Pre-training)、模型微调(Fine-tune)及奖励模型(Rew ard(Model)等过程中所需数据(例如指令(instruction)类数据)的质量,确保语言类和常识性知识之 外的其他垂直领域的应用场景的能力提升,为大模型精确性、通用性及泛化能力的实现奠定坚实基础。 在以上背景下,一方面,大规模、多样化、高质量数据集重要性凸显,成为模型训练效果的核心支撑之 一。另一方面,AI发展所面对的数据前沿性及工程化技术的挑战也更为显著。长期看,只有AI数据处理技术 的不断拓新与发展,才能及时适应甚至超前引领大模型技术和应用的发展。b.多模态数据受AIGC、虚拟人等 应用发展驱动,将呈现快速增长趋势随着AIGC技术发展,AI可在更多维度、更多场景辅助人类进行内容生产 以及创作。例如,通过大模型等AIGC技术,人类仅需输入一段简单的文字指令,AI即可按照人类描述生成一 幅画、一段语音或一段视频,以此帮助人类完成内容创作。想要实现上述功能,AI除了要具备理解人类文字 指令的能力,还需要通过对齐不同独立模态关键特征的方式,建立文字与图、语音、视频等一一映射关系, 这背后将依赖大量的多模态数据,AI需要对多模态数据进行学习,以实现跨模态的创作能力。 此外,随着AI虚拟主播、虚拟学生、虚拟员工轮番上岗,数字人概念逐渐走入大众视野,成为人工智能 的热门技术赛道。想要让虚拟数字人实现与人类的自然交互,不仅需要发音标准自然、身体动作流畅,其表 情、口型与声音也要实现细节的精准匹配,而多模态技术就是打破传统人工智能单一感官局限、让各类AI能 力协同使用的重要技术。通过对高质量多模态训练数据集的持续学习,AI可实现图像、视频、音频、语义文 本等多维度能力的融合,使得虚拟人在行为上更接近人类。 未来,随着以AIGC、虚拟人为代表的AI技术以及应用的不断发展,多模态数据需求将呈现加速增长趋势 ,具备多模态数据服务能力,以及多模态数据集储备的企业将获得更多市场机会。c.人工智能企业全球化布 局加速,多语种能力成为企业业务拓展核心支撑2013年,共建“一带一路”的倡议正式面世,十年来,随着 国家“一带一路”战略的深入推进,国内一批具有较强创新能力和过硬技术实力的企业,纷纷踏出国门,积 极拓展海外市场,通过不断扩大企业出海战略版图,获得高速发展机会。另一方面,境外头部企业也继续践 行“全球化”战略,搭乘全球出海的快车。 随着境内、外企业的全球化扩张成为确定性趋势,多语种能力作为支撑企业顺利出海的核心要素之一, 重要意义更加凸显。未来,多语种训练数据将对客户侧在语音助手、智能汽车、智能家居、智能客服、机器 人、多语种OCR等各领域产品/应用的全球化推广起到积极作用。因此,随着各类客户群体扩张步伐加速,多 语种需求也将快速增长,具有强大语言研究能力的数据服务企业将获得更多商业机会。 d.人工智能技术加速向产业渗透融合,催生更多垂向领域数据需求 随着深度学习技术的不断突破,人工智能发展已经进入2.0时代,相关训练需求正逐渐从通用基础能力 建设,向更为专业的垂向场景/行业拓展。一方面,以大模型为代表的AI基础技术不断取得重大突破,AI模 拟人类认知的能力飞速提升,因此从技术能力维度看,AI已具备与垂直产业融合并规模化应用的前提条件; 另一方面,受国家数字经济发展战略推动,产业数字化和智能化将进一步席卷各行各业,智能化技术与传统 产业的融合将成为数字经济时代的新发展趋势,并创造出巨大的蓝海空间。 当前AI技术正在加速与各类产业融合,在汽车、金融、医疗、工业等传统行业的渗透率和应用场景不断 提升,展现出可观的商业价值和巨大的发展潜力,而数据作为打通算法技术与行业需求的核心桥梁,作用更 加凸显,可以说数据能力一定程度上决定了算法模型在对应产业的适用性以及实用性,成为加速AI产业化落 地的关键要素。 e.国家法律法规密集落地,对数据安全及合规提出更高要求 近年来,数字经济规模快速扩张,数据作为数字经济时代核心生产要素,重要性更加凸显,但数据不同 于传统生产要素,其中可能涉及个人隐私以及国家安全的重要信息,因此,为更好保障数字经济长期稳定的 可持续发展,建设规范、安全、合规、高质量的数据安全体系已成为迫切需求。近年,国家陆续出台包括《 数据安全法》、《个人信息保护法》等主流法律法规,为解决数据安全问题、净化行业快速发展中的不良乱 象提供了切实可行的法律依据。 未来,随着AI技术不断革新,应用行业以及场景不断增加,各行业、各领域数据安全规范逐渐落地将成 为趋势,对于以数据生产为主营业务的数据服务企业,数据安全及合规能力将成为数据服务能力的核心评价 维度,成熟的安全合规管理体系将成为重要评价标准,能持续跟踪法律环境变化,积极响应监管政策,牢牢 把握发展与安全并重的原则的企业将具有更强的市场竞争力。 1.2行业的主要技术门槛 随着AI技术不断演进、产业应用不断丰富,训练数据的市场需求呈现体量、难度、复杂性、合规性持续 上升的趋势,数据服务商须同时具备对人工智能核心算法的理解能力、前瞻性的专业数据集设计能力、丰富 的语言覆盖能力及场景采集能力、算法辅助数据生产能力、以及数据合规管理能力,这使得行业的技术门槛 持续提升,具体体现为: (1)在训练数据研发、生产全流程中的算法全面介入 随着AI技术应用落地的规模化效应凸显,客户对于数据规模和处理效率的要求不断提升,数据服务商须 在研发、生产流程中全面引入算法以实现高效、合理的人机协作模式,进而实现降本增效的目标。一般而言 ,在训练数据研发、生产全流程中融入算法技术,可用于训练数据集的设计及训练数据生产的各个环节,例 如调度不同类型的标注人员应对不同领域的任务、形成算法自动处理能力以帮助标注人员提升效率、降低对 人员的依赖(既有人员数量的降低、也有对人员标注能力要求的降低),并构建训练数据设计、加工相关的 核心技术;也可用于检查训练数据集对算法模型的训练效果,进而保障训练数据集质量。 (2)平台工具链功能及适配性要求持续提升 当前,客户侧的数据采集、标注需求范围在逐渐拓宽,数据采集与标注需满足的AI应用场景比以往明显 更加广泛、复杂,这就对数据服务商的平台工具能力提出了更高要求,平台上处理过多大规模的数据、这些 处理过的数据的多样性和复杂程度如何、算法引擎投票机制如何建立、置信区间如何设置、算法在平台中如 何应用、数据流转的工程化程度如何等等这些因素都决定了平台的适配性和能力如何,并最终决定了数据处 理的质量、效率、成本。 (3)语音语言学基础研究方面须有深厚积累 伴随语音技术进一步发展落地、并向各行各业和更多垂直场景不断渗透,同时受到中国企业出海需求、 国外企业区域拓展需求两方面的支撑,客户在多语种、多音色、音素集、发音规则、发音词典等方面的要求 在不断抬升,这意味着只有那些在语音语言学基础研究方面投入更多、拥有深厚积累的数据服务商才能满足 客户在这方面的多元化需求。 因此,市场上仅有极少数企业通过长期自主研发的方式能够达到上述核心技术门槛,成为有能力向不同 客户群体提供综合、高效、合规的数据产品及服务的供应商。 2.公司所处的行业地位分析及其变化情况 作为行业的头部阵营企业,海天瑞声在经营情况、技术实力、以及以数据安全为代表的其他综合能力方 面都展示出明显优势,并具有较强国际竞争力。近年来公司紧跟AI技术发展趋势,尤其关注在客户资源、技 术实力、产品/服务等方面的竞争优势,树立国内领先基础数据服务商的品牌形象,以巩固公司的行业领先 地位。 (二)主营业务情况说明 公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对 取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。 算法、算力、数据是人工智能技术发展的三大要素,其中训练数据是算法发展和演进的“燃料”。在当 前技术发展进程中,深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的 训练支撑则是深度学习算法实现的基础。深度学习分为“训练”和“推断”两个环节:训练需要海量数据输 入,训练出一个复杂的深度神经网络模型;推断指利用训练好的模型,去“推断”现实场景中的待判断数据 ,并得出各种结论。训练数据越多、越完整、质量越高,模型推断的结论越可靠。因此,要使算法模型实现 从技术理论到应用实践的落地过程,就需要提供大量的训练数据,对算法模型加以训练。通常,从自然数据 源简单收集取得的原料数据并不能直接用于深度学习算法的训练,必须经过专业化的采集、加工处理,形成 相应的工程化数据集后才能供深度学习算法等算法、模型训练使用。 自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集 。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标 准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据涵盖智能语音(语音识别、语音合成 等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能家居、智能驾驶、智慧金融、智 能安防等多种创新应用场景。 公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三 星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服 务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前公司客户累计数量 为881家,覆盖了科技互联网、社交、IoT、智能驾驶、智慧金融等领域的主流企业,教育科研机构以及部分 政企机构。 (三)主要经营模式 1.盈利模式 与主要产品及服务类型对应,公司的盈利模式主要包括以下三类: (1)定制服务:公司根据客户需求提供定制训练数据集并收取服务费。在此种模式下,公司享有服务 费收入,不享有最终生成的训练数据的知识产权,不可将此类业务生产的训练数据向其他客户重复销售。 (2)标准化产品:公司开发自有知识产权的训练数据集产品,通过销售训练数据集产品的使用授权许 可,获取让渡资产使用权收入。此类训练数据集一经开发完成,可多次销售并获取授权许可收入。 (3)训练数据相关的应用服务:公司基于生产的训练数据提供算法模型相关的模型拓展及训练服务, 通常以软件授权或软硬件一体化形式交付算法模型拓展、开发成果,获取让渡资产使用权收入和技术服务收 入,以及少量硬件销售收入。 2.生产或服务模式 (1)训练数据集生产模式 公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模 型训练使用的专业数据集。 公司的训练数据生产过程主要包括四个环节:设计(训练数据集结构设计)、采集(获取原料数据)、 加工(数据标注)及质检(各环节数据质量、加工质量检测)。 (2)训练数据相关的应用服务模式 公司基于其生产的训练数据提供算法模型相关训练服务,助力下游客户完成其算法模型的语言拓展、特 定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定行业和口音的专属算法模型,提高AI技术应用 效果。 以某大型科技公司客户项目为例,客户研发了特定语音识别算法模型,需要根据算法模型的实际场景( 如法院庭审场景)开发落地应用。公司承担了部分落地应用拓展相关的开发工作,围绕客户的算法模型和接 口开发,最终协助客户算法模型实现多个麦克风收集庭审语音内容并实时转成文字记录入系统的功能。 3.采购模式 按照采购的内容及主体划分,公司的采购包括: 数据服务采购:公司在数据采集、加工环节中,向人力资源服务等类型的公司等供应商采购的,非核心 技术环节的原料数据采集、标注服务。 岗位服务采购:主要针对临时性的、不设长期岗位的业务领域的外包采购,如保洁、临时招聘服务、少 量实习生招聘等。 其他采购:(1)训练数据生产所需的资产,主要包括软、硬件设备及其他需求物品采购;(2)日常运 营所需的资产及物品,如办公用房、车辆、办公家具、计算机设备等;(3)日常专项服务采购等,主要包 括审计服务、会议服务、差旅服务等。 上述原料数据采集、加工环节所涉及的数据服务采购,为公司最主要的采购类别,由集采中心负责;各 部门岗位服务采购由人力资源部负责;其余日常运营相关的资产物品采购、专项服务采购等非业务采购由集 采中心负责。财务中心负责参与采购供应商的遴选、监督与管理,并对采购费用进行核算及结算。 经过多年的发展,公司已经建设有完善的《海天瑞声采购管理制度》、《海天瑞声项目资源采购管理制 度》、《海天瑞声供应商管理制度》、《海天瑞声岗位服务采购管理制度》等内部规范制度,设立有完善的 采购流程和体系,并与主要的供应商形成了良好稳定的长期合作关系。 4.销售模式 公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高品质的训练数据集及 相关服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过直接拜访潜在客户、口 碑传播、参与学术会议和行业展会、官方网站和自媒体展示等方式建立品牌知名度、与客户建立联系,后续 再通过商务谈判、招投标等形式获取具体业务机会。 二、核心技术与研发进展 1.核心技术及其先进性以及报告期内的变化情况 公司高度重视并坚持科技创新,通过持续的研发投入积累形成了12项核心技术,覆盖基础研究、平台工 具、训练数据生产三个层次,应用于训练数据生产的设计、采集、加工、质检全流程之中。 (1)基础研究层面,报告期内,公司持续在智能语音、计算机视觉、自然语言、以及包括智 能驾驶为代表的垂直领域进行技术拓展,并有多项核心技术取得显著进展。例如,在基础算法研究方面 ,新增数十个基础模型,包括波兰语、斐济语等多个ASR语音识别模型、多语种合成数据库韵律预测模型、2 5类自动驾驶场景交通目标物检测模型、3D动捕数据姿态检测模型等众多模型;

www.chaguwang.cn & ddx.gubit.cn 查股网提供数据 商务合作广告联系 QQ:767871486