经营分析☆ ◇688207 格灵深瞳 更新日期:2025-01-15◇ 通达信沪深京F10
★本栏包括【1.主营业务】【2.主营构成分析】【3.前5名客户营业收入表】【4.前5名供应商采购表】
【5.经营情况评述】
【1.主营业务】
提供面向城市管理、智慧金融、商业零售、体育健康、轨交运维等领域的人工智能产品及解决方案。
【2.主营构成分析】
截止日期:2024-06-30
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
人工智能产品(产品) 4789.62万 93.35 3202.62万 92.63 66.87
技术服务及其他(产品) 341.36万 6.65 254.67万 7.37 74.61
─────────────────────────────────────────────────
境内(地区) 5130.98万 100.00 3457.29万 100.00 67.38
─────────────────────────────────────────────────
截止日期:2023-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
智慧金融产品及解决方案(行业) 2.20亿 83.98 1.12亿 75.58 50.90
城市管理产品及解决方案(行业) 3153.82万 12.02 2831.76万 19.09 89.79
其他(补充)(行业) 1048.37万 4.00 790.56万 5.33 75.41
─────────────────────────────────────────────────
智源智能前端产品(产品) 2.05亿 78.16 1.02亿 69.01 49.94
深瞳行业应用平台(产品) 3380.84万 12.89 2760.71万 18.61 81.66
其他(补充)(产品) 2348.02万 8.95 1836.25万 12.38 78.20
─────────────────────────────────────────────────
境内(地区) 2.62亿 100.00 1.48亿 100.00 56.56
─────────────────────────────────────────────────
直接销售(销售模式) 2.62亿 100.00 1.48亿 100.00 56.56
─────────────────────────────────────────────────
截止日期:2023-06-30
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
人工智能产品(产品) 1.37亿 86.73 --- --- ---
技术服务及其他(产品) 2089.11万 13.27 --- --- ---
─────────────────────────────────────────────────
境内(地区) 1.57亿 100.00 9771.20万 100.00 62.06
─────────────────────────────────────────────────
截止日期:2022-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
智慧金融产品及解决方案(行业) 3.11亿 88.07 1.73亿 84.55 55.49
城市管理产品及解决方案(行业) 3612.28万 10.21 2666.03万 13.04 73.80
其他(补充)(行业) 606.32万 1.71 491.21万 2.40 81.01
─────────────────────────────────────────────────
智源智能前端产品(产品) 2.90亿 81.96 1.63亿 79.93 56.36
深瞳行业应用平台(产品) 3587.69万 10.14 2541.55万 12.43 70.84
其他(补充)(产品) 2790.47万 7.89 1560.92万 7.64 55.94
─────────────────────────────────────────────────
境内(地区) 3.54亿 100.00 2.04亿 100.00 57.80
─────────────────────────────────────────────────
直接销售(销售模式) 3.54亿 100.00 2.04亿 100.00 57.80
─────────────────────────────────────────────────
【3.前5名客户营业收入表】
截止日期:2023-12-31
前5大客户共销售2.40亿元,占营业收入的91.56%
┌───────────────────────┬───────────┬───────────┐
│客户名称 │ 营收额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│中国农业银行股份有限公司 │ 21671.04│ 82.62│
│中星微技术股份有限公司 │ 666.62│ 2.54│
│中科华讯科技开发有限公司 │ 648.12│ 2.47│
│安徽云森物联网科技有限公司 │ 574.92│ 2.19│
│嘉逊发展香港(控股)有限公司 │ 457.44│ 1.74│
│合计 │ 24018.14│ 91.56│
└───────────────────────┴───────────┴───────────┘
【4.前5名供应商采购表】
截止日期:2023-12-31
前5大供应商共采购0.55亿元,占总采购额的68.21%
┌───────────────────────┬───────────┬───────────┐
│供应商名称 │ 采购额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│第一名 │ 2173.73│ 27.11│
│第二名 │ 1333.26│ 16.63│
│深圳市华科博创信息科技有限公司 │ 805.82│ 10.05│
│安擎计算机信息股份有限公司 │ 638.76│ 7.97│
│第五名 │ 517.35│ 6.45│
│合计 │ 5468.92│ 68.21│
└───────────────────────┴───────────┴───────────┘
【5.经营情况评述】
截止日期:2024-06-30
●发展回顾:
一、报告期内公司所属行业及主营业务情况说明
(一)公司所属行业
根据国家统计局《国民经济行业分类》(GB/T4754-2017),公司属于“软件和信息技术服务业”(行
业代码为I65)。根据《战略性新兴产业分类(2018)》,公司属于“新一代信息技术产业”中的“人工智
能”行业。
伴随人工智能技术的加速演进,围绕大模型等前沿热点领域的研究持续深入,生成式人工智能等新赛道
为产业注入新的增长点。大模型已成为孕育新质生产力的沃土,自然语言处理、多模态等领域研发提速,通
用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型将广泛赋能社会多个领域,产业应用将进一
步加速落地,推动新一轮的科技革命与产业变革。
我国高度重视人工智能行业的发展,出台了一系列扶持政策和规划,强调人工智能和产业发展融合,为
高质量发展提供新动能。2024年2月,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会
,强调中央企业要把发展人工智能放在全局工作中统筹谋划,加快布局和发展人工智能产业,深入推进产业
焕新,进一步深化开放合作,开展AI+专项行动,加快重点行业赋能,构建一批产业多模态优质数据集,打
造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态;2024年3月,《2024年国务院政府
工作报告》提出深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字
产业集群,这是“人工智能+”首次被写入政府工作报告中,体现了国家对数字经济和人工智能产业的重视
。各地方政府也在积极实施“人工智能+”行动,印发各类政策推动构建人工智能生态,加强科技、产业与
金融的协同,开放更多人工智能应用场景,与企业共同探索落地的商业模式。
(二)公司主营业务情况
公司以“让AI造福人类,让世界更安全更宜居更健康”为愿景,专注于将先进的计算机视觉技术、大数
据分析技术、机器人技术和人机交互技术与应用场景深度融合,提供面向智慧金融、城市管理、智慧商业、
轨交运维、体育健康、元宇宙的人工智能产品及解决方案。
公司经过多年的技术研发与积累,已有效掌握了多模态大模型技术、3D立体视觉技术、大规模跨镜追踪
技术、自动化交通场景感知与事件识别技术、机器人感知与控制技术、沉浸式交互感知技术等方向的多项核
心技术,凭借过硬的技术能力和长期的商业化经验,已成功在智慧金融、城市管理、智慧商业、轨交运维、
体育健康五大领域实现落地应用,其中:智慧金融领域已覆盖农业银行全国各省市的上万家网点,包含智能
安保、智能运营、智能风控等多个金融业务场景,同时,公司参与搭建某国有银行总行AI平台,并开始在其
他国有银行分支行进行试点;城市管理领域已覆盖全国多省市的公安局、公安交通管理局、政法委员会等政
府机关或企事业单位,车路协同感知MEC产品已进行交付,同时车载视频违规事件取证产品已在多省市开展
试点;智慧商业领域主要收入来自排名前列的地产类客户,进一步完善的智慧油站产品和解决方案在中国石
化重新启动试点应用;轨交运维领域公司自研的列车智能检测解决方案已在高铁和地铁项目中落地应用,为
列车的安全运维提供保障,在研产品己涵盖轨交机务、电务和工务三大场景;体育健康领域公司发布了深瞳
阿瞳目体育训考系统、体感交互系统、体育大数据系统系列产品和解决方案,开发体育教育市场的渠道产品
,建设了国家人工智能学生体质健康测试标准化考场,体育训考全流程解决方案已在全国多个校园试点应用
、销售,大规模应用于北京、河北等多个区县的初中学业水平考试体育现场中,也应用于北京某区的国家学
生体质健康考试统测和某区的高中年级体育毕业会考等场景中。除此之外,公司在元宇宙等领域进行前瞻性
的布局,探索元宇宙领域发展运营模式、开发多类型交互内容,公司产品、整体解决方案和基于大模型的行
业应用的研发和落地工作按计划有序推进。公司从客户需求出发,面向智慧金融、城市管理、智慧商业、轨
交运维、体育健康、元宇宙不同领域的客户,提供相应的行业解决方案。
(三)主要经营模式
1、盈利模式
公司主要从事计算机视觉技术、大数据分析技术、机器人技术和人机交互技术的研发和应用。公司的盈
利来源于向客户提供面向应用场景的人工智能产品及解决方案获得销售收入。公司自主研发的人工智能产品
主要包括智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台。人工智能产品既可以标准化模式销售
,也可根据客户需求进行产品组合,提供定制化服务,以整体行业解决方案向客户交付。
2、研发模式
公司拥有完整的研发组织架构与创新机制,以用户需求为核心,采用迭代、循序渐进的敏捷方法进行研
发活动,并对整个产品生命周期进行管理,在过程中不断对执行结果和阶段目标进行总结复盘,通过不断迭
代完善产品质量和改进研发过程。
(1)在产品需求调研阶段,公司对行业发展趋势、市场规模和用户核心需求进行调研分析,并结合公
司产品战略规划,由产品团队完成需求分析,确定产品的核心目标特性和功能,由研发团队进行技术路线规
划。
(2)在可行性验证阶段,公司进行大量算法实验以寻找合理科学的解决方案,产品经理、算法工程师
、软硬件开发工程师和测试团队密切配合,在产品负责人的协调下进行多次短平快的软件原型迭代,每一次
迭代都会在产品实际使用场景中进行反复实验确认,通过与客户持续沟通,调整和优化,确认产品最终形态
的各功能模块和参数指标,并明确研发周期。在整个过程中,算法团队负责完成实验场景的建设和数据收集
,并进行验证性实验;软件开发团队负责针对应用场景进行原型验证和开发;智能硬件团队负责对硬件产品
的相关指标进行可行性实验和评估。
(3)在产品研发阶段,产品经理将总结可行性验证阶段的成果,转化为产品功能指标及开发任务,确
保产品交付节点和产品定义与用户预期保持一致;算法和工程团队协同完成算法模型设计开发、数据收集清
洗、功能特性开发等工作;测试团队按照产品定义对产品每个开发版本进行验收,并完成自动化测试脚本;
智能硬件团队完成新硬件产品的选型评估和整体设计,有效评估产品适用性、稳定性、可靠性、国产化率等
特性,并负责设备软件开发和集成,交付少量可以进行测试认证的工程样机。该阶段产品会发布多个内外部
测试版本,在实践中进行快速迭代。
(4)产品发布阶段是在产品完成核心功能开发后,产品经理建立产品的标准文档、销售价格、实施方
案、售后体系,通过与质量、市场、销售等部门确认,满足目标市场的销售条件时,产品正式发布;新的硬
件产品会在这一阶段完成小批量验证和量产导入,实现加工生产工艺所需要的工装硬件和工具软件;测试团
队进行大量密集的现场测试,确保产品满足产品定义的各类功能指标,并完成质量验收。这一阶段的完成标
志产品正式版本发布。
(5)产品运营阶段在产品正式发布后,产品经理结合市场反馈与发展趋势,制定多个后续产品版本,
不断创新,推出符合市场需求的产品新版本,以对产品进行持续的运营、维护和改进。
3、采购模式
公司专注于人工智能产品及解决方案的研发和销售,不涉及硬件的直接生产。
针对标准硬件、配件及服务类采购,公司直接向供应商提出待采购产品或服务的需求,供应商按照指定
的时间和地点进行交付;针对定制化硬件,公司采购主要原材料并发货至委外加工厂,由其进行生产加工。
公司选择专业的代工厂,依托其已有的完善的品质控制、生产制造管理和硬件设施进行专业的代工生产。公
司通过新产品导入、质量检验标准发布、生产工艺发布、测试检验工具发布等方式确保产品生产的有效性、
一致性和稳定性。
4、销售模式
公司结合下游行业的业务特点与主要产品的市场定位,在直接销售体系的基础上,积极开发渠道商,向
终端客户或渠道客户(含集成商)销售人工智能产品及解决方案,使产品以不同的方式触达更多的客户,提
供更加及时、高效的销售服务。其中终端客户是指直接使用公司产品及解决方案的各行业领域客户,包括金
融机构、政府部门、公安机关、企事业单位等;集成商是指承担系统集成、安装部署、运营维护等职能的企
业,包括终端客户的项目总包方或其指定的工程服务商等。公司与客户直接对接需求,通过商务谈判、参与
招投标等方式获取订单。公司建立了完善的直销服务体系,目前已在全国划分了华东、华中、华北、东南、
西南、东北、西北七个大区进行区域化和行业化的矩阵式管理,以提供及时、高效的销售服务。
二、核心技术与研发进展
1.核心技术及其先进性以及报告期内的变化情况
公司打造了底层AI技术平台——深瞳大脑,深瞳大脑作为公司核心技术的驱动平台,赋能公司人工智能
产品及解决方案的技术实现。深瞳大脑包含数据平台和训练平台,由数据采集、数据预处理、数据标注、模
型训练、模型优选、数据管理等模块组成。
数据平台支持多源多模态数据的自动收集和清洗归类,通过构建自动化处理为主、人工标注为辅的标注
体系,形成海量增长的标签数据池,有效节省标注成本,提高了算法模型的研发效率;通过组建具有专业背
景的标注团队,用人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据,同时通过数据
团队对开放数据的收集和挖掘,为公司在海量数据下训练高水平模型做好数据准备;训练平台则有效提高了
模型训练的自动化水平,降低算法多平台部署应用的迁移难度,为算法高效生产及快速商业化应用奠定了重
要基础;训练平台同时支持在海量数据中进行挖掘,主动触发模型更新训练,可以有效的提高算法的准确率
和生产效率,并进一步提高产品的交付能力。目前,公司深瞳大脑可支持数十亿训练数据、数亿类别任务,
数百亿参数多模态大模型的训练。训练平台生产高质量的算法,推动应用的落地,数据平台收集应用产生的
高质量数据又促进算法的提升,从而算法、应用、数据在深瞳大脑系统内形成人工智能的正向循环,为公司
的高效研发创新与产业应用提供了有力支持。
(1)多模态大模型技术
公司利用自研的底层AI技术平台深瞳大脑对数十亿训练数据进行清洗和预处理,并基于大规模数据训练
数百亿参数的大模型,在海量数据下,研发了基于图像、语言、语音多种模态的弱监督大模型训练算法,节
省了大量数据标注资源。针对海量数据中存在噪声的问题,研发了标签重写算法,高效地提升了数据质量。
上述算法已投稿到国际顶级会议ICLR2023、ICCV2023和ECCV2024并被接收,公司已在业务中利用该大模型提
升少样本场景的准确率,在复杂场景中效果远优于传统小模型。结合高质量的语言模型,公司正在研发多模
态大模型,该模型能接受图像、语言等多种模态的输入,能够完成多模态融合理解,提升业务的应用潜力。
跨平台模型训练技术用于简化AI算法生产,该技术基于自主研发的训练框架,和自主研发的预训练模型
可实现常用业务AI算法的一键式训练,为常见业务中的分类、检测、分割等算法提供便捷快速的实用模型。
针对不同应用场景的算法开发,公司自主研发的跨平台模型训练技术可将训练任务管理平台产出的模型自动
发布到各种类型的显卡或平台,包括英伟达显卡、海思系列芯片、华为昇腾系列芯片、算能计算平台等,无
需人工干预,从而达到模型快速高效交付的目的,可有效的降低研发成本,有助于提升产品的市场竞争力。
基于自主学习的训练平台解决方案,也已经在公司多个重点项目上线,实施后大量长尾业务的迭代周期大幅
缩短,准确率提升效果显著。
(2)3D立体视觉技术
3D立体视觉一般通过结构光、激光雷达等特殊传感器采集得到场景的深度信息,再利用深度信息和可见
光信息一同计算出场景的三维图像。
多目传感器标定与深度估计技术使用一对成本更为低廉的可见光相机组成双目系统,对场景深度信息进
行估算,在达到普通结构光相机精度的同时,提高了相机的可靠性和易用性,并能覆盖更多的结构光相机无
法工作的光线条件和场景。基于这项技术的输出,使公司的算法能更好地适应多种不同的场景和目标,进而
对人体、物体、场景进行高精度的重建。
运动姿态分析技术通过采集不同场景下人体姿态数据,通过自主研发的三维人体姿态估计算法,能够解
决人体关键点数据采集不准确或不稳定的问题。公司基于单目相机的三维重构技术结合动作模型库及人体运
动功能学的特点,优化了使用单目相机获取三维人体关键点的效果,解决了基于二维人体关键点进行判断的
难题,使得运动姿态分析算法在三维人体上做出更为精准的判断,进而可以应用在体育健康与行为分析领域
对人体三维姿态的准确识别与分析。
运动姿态分析技术在智慧金融领域可以协助银行客户进行员工履职分析与管控,人员重点区域违规管控
(如非授权人进入、员工缺岗等)、人员操作异常管控(如单人加钞、大额现金遗留等)、人员动作异常管
控(如异常倒地、打架、各类防护舱业务等)等项目均达到较高的检测精度;而在体育健康领域,该技术可
评判用户动作是否完成及标准程度,评判仰卧起坐、引体向上、跳绳、篮球交替运球、篮球护球训练等17项
基础测试和训练动作时,也可具备较高水平的检测精度,公司在由北京图象图形学学会、清华大学、蚂蚁安
全实验室等机构联合发起第一届花样滑冰动作识别挑战赛中,运用领先的运动姿态分析技术获得了冠军。3D
重建与立体视觉分析技术在轨交运维场景可将离散的局部列车零部件数据进行融合和重构,得到列车标准模
型,将几何模型分析、深度学习等技术运用到列车标准模型、点云数据、图片等多维度数据,进行零部件匹
配和故障诊断。公司基于深度学习的点云配准技术已在多个学术数据集上取得第一,通过点云几何结构和基
于Transformer的多层特征投票机制提升正确匹配点云比例,提升点云配准精度,在真实业务测试集上旋转
向量误差小于1度、平移向量误差小于0.3mm,该技术对产品落地起到了至关重要的作用。目前,公司产品已
覆盖列车常见的190余种故障项点,项点处理速率超过20000个/小时,在高级重要性项点的故障诊断成功率
大于95%,对于高精度测量的项点,测量精度到达亚毫米级别。
(3)自动化交通场景感知与事件识别技术
公司拥有国内领先的车辆识别技术,能够运用高精度目标检测与跟踪技术对大陆号牌、港澳号牌、非机
动车号牌等多种类型的车牌进行多种尺寸和角度的识别,支持倾斜角度在45°范围内的车牌,准确率在99%
以上。同时,公司支持的机动车、非机动车、人体属性识别多达50余项,重点属性识别准确率超过95%。
在对交通场景中车辆进行分析时,公司结合在人脸识别技术上的优势研发了多目标属性识别与对象关联
技术。该技术可以将车内驾驶员与车辆绑定,协助交通管理部门和公安部门查找可疑人员,提供破案线索。
由于车内光线较暗、抓拍受挡风玻璃干扰、司乘人员人脸姿态不受控、人脸有遮阳板墨镜口罩等遮挡的原因
,普通的人脸识别算法都会有较大的下降,公司在人脸识别技术上的优势可以做到在以上困难环境下仍能达
到较高的识别率。
公司研发的交通场景理解及事件检测识别技术,基于自适应交通场景理解和车辆特征识别的技术能力,
无需人工标注,可自动化识别闯红灯、不按导向行驶、不礼让行人等11种交通违法场景,同时结合车辆重识
别技术可准确定位车辆位置,实现对交通视频的自动分析、事件预警和违法事件的自动审核。
(4)大规模跨镜追踪技术
公司拥有完全自研的人脸识别算法和引擎技术,在多种光线条件、人脸角度的场景下都能达到较高的识
别准确度。公司在研发过程中开源了TrillionPairs和Glint360K两个人脸识别数据集以及PartialFC训练代
码,其中PartialFC相关论文已被视觉顶尖会议CVPR2022接收,推动了行业技术的发展。公司的人脸识别技
术在公开数据集MegaFace上识别准确率达到99.1%。公司在公安部治安管理局亿级人像算法测试中,1比1人
像比对测试万分之一误识率下的通过率为99.97%,5万样本比1亿级人像比对测试中首位命中率超过98%,均
高于行业平均水平。
公司研发的百亿级人员聚类技术可支撑上万路摄像头接入并实时完成动态聚类,支持室内场景和光照、
质量和姿态等都不受控的室外复杂场景中的大规模商用。
为了达到上万路摄像头接入并实时完成动态聚类的应用要求,公司研发了海量数据以图搜图技术。公司
研发的以图搜图引擎支持多架构、不同计算设备上的图片检索功能。针对检索频率高实时要求强的场景,以
图搜图引擎支持英伟达全系显卡以及华为计算卡的图片检索。针对检索频率低实时要求不强,但图片数量较
大的场景,单机可实现上亿人脸图片秒级返回,集群可实现数十亿级图片秒级返回。针对海量图片检索场景
,以图搜图引擎实现了单机检索30亿人脸图片20秒内返回结果的性能。配合集群可实现百亿级图片数十秒检
索的性能。针对上亿特征占用显存巨大的问题,公司研发了短特征技术,利用该技术能节省至少4倍显存,
同时召回率达到99.9%。该技术已广泛应用在公司多个应用场景的产品及解决方案中。
人脸属性表达技术在公共安全等场景具有广泛应用,同时也能辅助大规模人员聚类。公司研发的人脸属
性包括年龄、性别、种族、表情、姿态、遮挡、模糊等多项属性。该技术使用单模型、多任务协同训练策略
,利用各个属性任务之间的相关性来辅助训练单个模型,可在缩减运算资源的同时保证每个属性的精度。
公司多场景广覆盖人脸活体识别技术可应用在闸机口等通行相关的场景,公司已积累了千万级的攻击样
本,可防止人员通过打印照片、屏幕、3D面具等非活体人脸通过闸机。
(5)机器人感知与控制技术
公司将实时定位与建图技术、机械臂视觉反馈技术、机器人路径规划与自主导航技术运用于轨交运维机
器人等场景,算法适应性良好,机器人该场景中,以最高1m/s的速度做无碰撞运动,达到轨交运维应用所需
的技术水平。其中,机器人实时定位与建图技术,又称SLAM技术,在室内和半户外场景下拥有良好的定位精
度,在结构化的室内场景下,定位精度可达毫米级,在工业现场的半户外场景下,定位精度可达厘米级。同
时,公司针对SLAM普遍算力要求较高的问题做出了优化,完成SLAM模块向特定型号嵌入式主板的迁移和适配
工作;机械臂视觉反馈技术,又称手眼协同技术,在机械臂重复性动作的场景中收到良好效果,得到视觉反
馈之后的机械臂定位,较普通机械臂定位的精度有较大提升。同时,在保证精度的前提下,时间延迟不超过
1秒,保证了精度和实时性;机器人路径规划与自主导航技术,包含机器人定点巡逻、远程临场、人员跟随
等功能模块,运用于自动化检修场景中。
公司的机器人虚拟示教技术,能够通过高精度3D重建技术,搭建虚拟列车检修空间,构建一个包含作业
坑道、列车、机器人等元素,同时考虑物体碰撞、真实设备性能、环境噪声等因素的虚拟机器人作业空间。
在虚拟空间内进行机器人示教,通过控制虚拟空间中的机器人进行采集位置确认工作,支持多人协作和远程
操作,极大缓解项目实施过程中对真实列车的依赖,提升3倍以上的实施速度。
公司的机器人遥感技术则通过将虚拟点位下发给机器人,通过坐标空间变换、运动分解、轨迹规划等技
术,使机器人获取在物理空间中可执行的动作指令,该技术既支持异步动作执行,也支持在线的虚拟机器人
-真实机器人实时动作执行。为了提升机器人自主规划和控制能力,公司将自主研发的多模态大模型作为机
器人的大脑,使其逐步向具身智能靠拢。
(6)沉浸式交互感知技术
基于先进的人体跟踪和姿态分析技术,以及领先的三维场景重建技术,公司自主研发了“深瞳灵境”全
新沉浸式交互感知系统,通过自研的边端结合的软硬件一体解决方案,深瞳灵境创新性的实现了多项全新技
术和系统,包括支持远距离精确同步的多相机协同系统、在投影场景下完成人体成像的光学方案、高度精确
的3D人体姿态重建技术等,能够在全国产高性能AI处理芯片支持的相机和边缘智能计算设备上实现完整的非
侵入式人体位姿动捕方案。
同时,公司还自主开发了游戏道具实时交互系统,通过部署环境光标和为人员佩戴或在道具上装载自研
接收感应装置,依据环境光标,实时计算出位置和姿态,为用户提供高度代入的交互体验,在给予用户沉浸
体验的同时,通过高速计算系统使系统给出准确的交互反馈,达到了声、光、动一体的全新交互体验。
公司利用多年积累的人体姿态估计技术和三维重建技术,建设了完整的软件框架来支持上层内容开发者
,通过标准接口和标准能力,允许开发者快速完成交互内容建设,无需额外的门槛即可得到AI能力的加持。
2.报告期内获得的研发成果
截至报告期末,公司及控股子公司、孙公司共计拥有有效专利(不包含权利终止和转让)53项、有效软
件著作权(不包含权利终止和转让)159项。
三、报告期内核心竞争力分析
(一)核心竞争力分析
1、深耕于计算机视觉行业的技术研发优势
公司掌握计算机视觉领域的核心算法技术,已形成了多模态大模型技术、3D立体视觉技术、自动化交通
场景感知与事件识别技术、大规模跨镜追踪技术、机器人感知与控制技术和沉浸式交互感知技术六大技术方
向并拥有多项自主知识产权;公司的核心算法在国际、国内的权威机构和组织举办的算法比赛中多次名列前
茅,其中:公司在OpenFAD23竞赛的动作分类任务中获得第一,在2022年ECCVPointCloud-CChallenge点云分
割和点云分类两个赛道均获第2名;在第一届花样滑冰动作识别挑战赛中运用领先的运动姿态分析技术获得
了冠军;公司的人脸识别技术在公开数据集MegaFace上识别准确率达到99.1%,公司在公安部治安管理局亿
级人像算法测试中,1比1人像比对测试万分之一误识率下的通过率为99.97%,5万样本比1亿级人像比对测试
中首位命中率超过98%,均高于行业平均水平;公司的车辆识别技术能够对大陆号牌、港澳号牌、非机动车
号牌等多种类型的车牌进行多种尺寸和角度的识别,支持倾斜角度在45°范围内的车牌,准确率在99%以上
。同时,公司支持的机动车、非机动车、人体属性识别多达50余项,重点属性识别准确率超过95%,达到国
内领先水平。
公司建立了以数据平台与训练平台为核心,涵盖数据采集、数据预处理、数据标注、模型训练、模型优
选等模块的底层AI技术平台——深瞳大脑,有效提高了算法模型的研发效率及自动化水平。数据平台支持多
源多模态数据的自动收集和清洗归类,通过构建自动化处理为主、人工标注为辅的标注体系,形成海量增长
的标签数据池,有效节省标注成本,提高了算法模型的研发效率;训练平台则有效提高了模型训练的自动化
水平,降低算法多平台部署应用的迁移难度,为算法高效生产及快速商业化应用奠定了重要基础。公司利用
深瞳大脑对数十亿训练数据进行清洗并基于大规模数据训练大模型,在海量数据下,研发了基于弱监督的大
模型训练算法,节省了大量数据标注资源,提升了少样本场景的准确率。数据、算法及应用在深瞳大脑内形
成人工智能的正向循环,为公司的高效研发创新与产业应用提供了有力支持。
经过多年持续研发的优化,公司的训练任务管理平台产出的模型可无需人工干预,自动发布到各种类型
的显卡或平台,包括英伟达显卡、海思系列芯片、华为昇腾系列芯片、算能计算平台等,从而达到模型快速
高效交付的目的。除了多模态大模型技术之外,公司还形成了3D立体视觉技术、自动化交通场景感知与事件
识别技术、大规模跨镜追踪技术、机器人感知与控制技术和沉浸式交互感知技术的技术方向,掌握了多目传
感器标定与深度估计技术、行为识别技术、人体姿态及动作分析技术、实时定位与建图技术和多精度目标检
测与跟踪技术等多项核心技术。
2、快速的商业化落地能力和良好的市场口碑
公司凭借高效的算法生产技术以及对各下游行业与应用场景的深度理解,形成了产品快速的商业化落地
的能力,并结合自研大模型技术,根据行业客户的需求不断优化、升级核心技术,公司的主营业务产品在下
游主要核心客户的认可程度高,良好的市场口碑为公司市场拓展及持续发展奠定了重要基础。公司成立至今
陆续开发了皓目行为分析仪、边缘计算设备、视图大数据平台、AI交通事件分析系统、AI智能管理和分析平
台、AI模型现场训练平台、列车智能检测平台、体育训考系统、体感互动系统、体育大数据系统、AI大型动
捕技术平台等核心产品,并在智慧金融、城市管理、智慧商业、轨交运维、体育健康、元宇宙等领域得到应
用。公司自主研发设计的智能化设备在农业银行各地分支机构推广使用,目前产品已覆盖上万家网点,包含
智能安保、智能运营、智能风控等多个金融业务场景;车路协同感知MEC产品已进行交付,同时车载视频违
规事件取证产品已在多省市开展试点;公司研发的边缘计算设备2018年一经推出就在中国石化的智慧油站项
目中得到快速应用;2020年初,公司在短时间内,利用人工智能和双光谱成像等技术积累,迅速推出双光温
测智能识别设备与应用系统,快速、精确、安全地进行体温测量与核查;公司的轨交运维解决方案在多个高
铁、城轨和机车领域的试点项目进入研发、测试或交付验收阶段,支持数条高铁、地铁线路的列车巡检业务
,通过点云技术对列车各零部件的数据进行高质量采集和智能分析,实现自动化的故障或缺陷检测,有效提
高了检修效率,保证了列车的运行安全,其中,自主研发的列车智能检测平台已经成功在高铁和地铁线路
|