经营分析☆ ◇300418 昆仑万维 更新日期:2025-05-03◇ 通达信沪深京F10
★本栏包括【1.主营业务】【2.主营构成分析】【3.前5名客户营业收入表】【4.前5名供应商采购表】
【5.经营情况评述】
【1.主营业务】
海外社交娱乐平台StarX,海外信息分发及元宇宙平台Opera、全球移动游戏平台Ark Games、休闲娱乐平台
闲徕互娱。
【2.主营构成分析】
截止日期:2024-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
互联网行业(行业) 55.88亿 98.69 41.02亿 98.47 73.40
其他行业(行业) 7423.71万 1.31 6356.05万 1.53 85.62
─────────────────────────────────────────────────
广告业务(产品) 21.45亿 37.89 10.94亿 26.25 50.97
Opera搜索业务(产品) 13.27亿 23.43 12.61亿 30.27 95.04
海外社交网络业务(产品) 10.83亿 19.13 8.12亿 19.50 75.01
游戏业务(产品) 4.44亿 7.85 4.05亿 9.72 91.10
闲徕社交娱乐平台业务(产品) 3.82亿 6.75 3.74亿 8.98 97.86
短剧平台业务(产品) 1.68亿 2.96 1.61亿 3.87 96.22
其他业务(产品) 7423.71万 1.31 6356.05万 1.53 85.62
AI软件技术业务(产品) 3858.35万 0.68 -524.51万 -0.13 -13.59
─────────────────────────────────────────────────
境外(地区) 51.52亿 90.98 37.32亿 89.60 72.45
境内(地区) 5.11亿 9.02 4.33亿 10.40 84.83
─────────────────────────────────────────────────
截止日期:2024-06-30
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
互联网行业(行业) 24.33亿 97.24 18.95亿 96.86 77.89
其他(补充)(行业) 5685.87万 2.27 5620.00万 2.87 98.84
其他业务(行业) 1210.18万 0.48 523.35万 0.27 43.25
─────────────────────────────────────────────────
广告业务(产品) 8.90亿 35.56 4.72亿 24.13 53.06
社交网络业务(产品) 6.79亿 27.15 6.16亿 31.47 90.66
搜索业务(产品) 6.23亿 24.90 5.94亿 30.37 95.37
游戏业务(产品) 2.41亿 9.64 2.13亿 10.89 88.40
其他业务(产品) 6896.05万 2.76 6143.35万 3.14 89.09
─────────────────────────────────────────────────
境外(地区) 22.05亿 88.16 16.86亿 86.19 76.46
境内(地区) 2.96亿 11.84 2.70亿 13.81 91.16
─────────────────────────────────────────────────
截止日期:2023-12-31
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
互联网行业(行业) 47.81亿 97.26 37.77亿 97.48 79.01
其他行业(行业) 1.34亿 2.74 9780.73万 2.52 72.74
─────────────────────────────────────────────────
境外(地区) 42.27亿 85.99 32.88亿 84.85 77.79
境内(地区) 6.88亿 14.01 5.87亿 15.15 85.30
─────────────────────────────────────────────────
广告业务(业务) 16.53亿 33.63 9.09亿 23.45 54.97
搜索业务(业务) 11.43亿 23.25 10.90亿 28.13 95.40
增值服务业务-社交网络-海外(业务) 9.74亿 19.81 8.56亿 22.09 87.92
增值服务业务-游戏(业务) 5.34亿 10.87 4.55亿 11.75 85.18
增值服务业务-社交网络-国内(业务) 4.77亿 9.70 4.67亿 12.06 97.96
其他业务(业务) 1.12亿 2.28 --- --- ---
技术收入(业务) 2262.46万 0.46 --- --- ---
其他(补充)(业务) 1.51万 0.00 --- --- ---
─────────────────────────────────────────────────
截止日期:2023-06-30
项目名 营业收入(元) 收入比例(%) 营业利润(元) 利润比例(%) 毛利率(%)
─────────────────────────────────────────────────
互联网行业(行业) 23.04亿 95.01 18.51亿 95.18 80.32
其他(补充)(行业) 1.21亿 4.99 9381.95万 4.82 77.53
─────────────────────────────────────────────────
广告业务(产品) 7.24亿 29.85 4.09亿 21.05 56.54
搜索业务(产品) 5.31亿 21.90 5.05亿 25.99 95.17
增值服务业务-社交网络-海外(产品) 5.06亿 20.86 4.40亿 22.63 87.00
增值服务业务-游戏(产品) 2.95亿 12.18 2.53亿 13.02 85.74
增值服务业务-社交网络-国内(产品) 2.48亿 10.23 2.43亿 12.48 97.87
其他产品(产品) 1.21亿 4.99 9380.44万 4.82 77.53
─────────────────────────────────────────────────
境外(地区) 20.23亿 83.42 16.02亿 82.39 79.20
境内(地区) 4.02亿 16.58 3.42亿 17.61 85.15
─────────────────────────────────────────────────
【3.前5名客户营业收入表】
截止日期:2024-12-31
前5大客户共销售28.04亿元,占营业收入的49.51%
┌───────────────────────┬───────────┬───────────┐
│客户名称 │ 营收额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│客户1 │ 161951.95│ 28.60│
│客户2 │ 48070.54│ 8.49│
│客户3 │ 26295.35│ 4.64│
│客户4 │ 23949.18│ 4.23│
│客户5 │ 20097.83│ 3.55│
│合计 │ 280364.85│ 49.51│
└───────────────────────┴───────────┴───────────┘
【4.前5名供应商采购表】
截止日期:2024-12-31
前5大供应商共采购5.12亿元,占总采购额的34.17%
┌───────────────────────┬───────────┬───────────┐
│供应商名称 │ 采购额(万元)│ 占比(%)│
├───────────────────────┼───────────┼───────────┤
│供应商1 │ 13711.08│ 9.16│
│供应商2 │ 11329.98│ 7.57│
│供应商3 │ 10148.39│ 6.78│
│供应商4 │ 9468.83│ 6.33│
│供应商5 │ 6494.86│ 4.33│
│合计 │ 51153.14│ 34.17│
└───────────────────────┴───────────┴───────────┘
【5.经营情况评述】
截止日期:2024-12-31
●发展回顾:
一、报告期内公司所处行业情况
自Transformer模型问世以来,AI大模型技术迅速发展,并在自然语言处理、计算机视觉及多模态理解
等多个领域取得革命性突破,使得生成式AI技术得以在内容生成、代码编写、复杂问答等任务中大放异彩。
进入2024年,全球大模型技术发展进入一个关键转折期。随着模型参数从数十亿跃升至上万亿级别,传统Tr
ansformer架构在训练和推理过程中所需的计算资源、能耗及延迟等问题日益突出。
为应对这些挑战,Mixture-of-Experts(MoE)架构应运而生。MoE模型通过将整体网络划分为多个专家
子网络,并根据输入数据动态激活部分专家,实现了参数规模的指数级扩展,并有效降低了推理时的计算负
担。同时,业界亦在不断优化提升MoE技术水平,如Google提出GLaM(GeneralistLanguageModel),通过门
控网络动态选择两个最合适的专家来处理数据,为计算带来更大的灵活性,有效提高模型效率;Meta则与普
林斯顿大学研究人员合作提出全新的Lory架构,通过引入因果分段路由策略与基于相似性的数据批处理方法
,显著提高了专家合并操作效率;而Microsoft则在其DeepSpeedMoE版本中,通过引入全新的Pyramid-Resid
ualMoE架构与Mixture-of-Students知识蒸馏技术,将训练成本降低5倍,并将推理延迟降低7倍以上。此外
,开源社区同样为MoE技术的推广与进步作出了不容忽视的贡献,如MistralAI的Mixtral8x22B、DeepSeek-M
oE与Skywork-MoE等模型的开源,有效推动了MoE技术普及,使得中小型企业可以低成本实现高性能模型部署
。同时,学术界亦在积极讨论诸如混合注意力、图神经网络协同、知识蒸馏与模型压缩等技术手段,以进一
步推动Transformer与MoE架构实现质的飞跃,为大规模生成式AI商业化落地提供坚实技术基础。
2025年初,DeepSeek爆火出圈。其R1模型于2025年1月20日上线,仅耗时十天,日活跃用户就突破2000
万,一举超过豆包成为国产日活跃用户最多的AI应用,同时也成为全球用户增长最快的AI产品。DeepSeek-R
1的出现标志着LLM推理能力进化的一次重要跨越。通过纯强化学习与蒸馏技术,团队不仅验证了模型自主进
化的可能性,更构建了从理论研究到产业落地的完整链条。它打破了“算力即竞争力”的固有认知,证明通
过数据质量优化、训练策略创新和软硬件协同设计,中小团队完全可能用千卡级甚至百卡级算力训练出顶级
模型。这一全新技术路线重新定义了行业竞争规则。当训练成本从千万美元级降至百万级,更多创业公司得
以进入核心赛道。通过云平台的弹性算力调度和开源模型生态的支持,5-10人团队完全可能打造出具备商业
价值的AI产品。这种转变不仅加速了技术落地,更催生出模型优化、数据标注、垂直领域适配等新产业环节
,构建起更健康的AI生态体系。
2024年,多模态大模型亦迎来迅速发展,实现了文本、图像、音频、视频等数据的深度融合,为人机交
互和实际应用提供了全新可能性。如OpenAI率先推出Sora视频生成模型,在前期DALL·E系列模型实现图像
与文本之间转换的基础上,进一步将高质量视频生成变为现实;Google则推出了全新的Gemini2.0系列模型
,实现文本、图像和语音多模态处理,并通过超长上下文窗口,增强感知能力;Meta则开源了首个多模态大
模型Llama-3.2,在图像识别和视觉理解基准测试中与领先的闭源模型不分伯仲。国内如字节跳动、阿里巴
巴、昆仑万维、腾讯、智谱等主要互联网及大模型厂商亦在多模态大模型领域取得显著进展,各厂商旗下多
模态模型理解和生成能力不断提升。互联网厂商还依托存量用户优势,大力进行应用拓展,推动了大模型在
各行业的广泛应用。
在AI视频生成领域,国内外厂商在模型性能、应用场景和商业化落地方面取得显著突破。以OpenAI的So
ra为起点,视频大模型技术路径逐渐清晰,国产模型如字节“即梦”、昆仑万维“SkyReels”、爱诗科技Pi
xVerse等亦迅速跟进,缩小与海外技术差距。当前,视频大模型已从实验室走向实际应用,覆盖影视制作、
广告营销、游戏开发、短视频创作等多个领域。在技术层面,DiT架构(扩散模型与Transformer结合)成为
主流,Sora验证了这一架构的可行性,国内外厂商如RunwayGen-3、快手可灵等均采用该架构,支持更长的
视频生成、高分辨率和流畅帧率。同时,开源与定制化趋势明显。智谱开源CogVideoX-2B模型,腾讯推出专
为游戏设计的GameGen-O模型,显示技术向垂直领域渗透。功能升级方面,首尾帧控制、运动笔刷、镜头路
径自定义等功能普及,提升用户对生成内容的控制。多模态融合也成为亮点,MetaMovieGen支持视频与音频
同步生成,AdobePremiere嵌入Pika、Sora等工具,推动全流程自动化。在市场应用方面,B端场景的降本增
效尤为明显。AI在影视制作领域广泛应用于微短剧(如《三星堆》《山海奇境》)、动画(《千秋诗颂》)
及特效制作,有效降低成本并缩短制作周期。在广告营销领域,广告商借助AI生成素材,使单条成本更低,
同时提升广告制作与投放效率。在游戏开发领域,AI被用于生成动态剧情,并优化买量素材,从而降低测试
与宣发成本。C端创作方面,短视频平台成为主要阵地。如抖音“即梦”支持用户创作AI微短剧。同时,UGC
生态逐步成熟,B站“AI影像”分区视频累计破万,头部内容播放量更是近千万。
在空间智能领域,2024年12月,李飞飞团队发布题为“GeneratingWorlds”的文章,介绍其首个空间智
能模型。该技术可以通过一张图片生成一个逼真的3D世界。用户只需上传一张图片,模型会自动估算出3D几
何结构,填充场景中未见的部分,并生成完整的3D场景。生成的3D世界可以在浏览器中实时呈现,用户可以
像在电子游戏中一样自由移动视角,甚至可以模拟如浅景深、多轴变焦等相机效果。
该技术还具有持久性和一致性,即场景一旦生成,不会随时间或视角变化而改变,同时符合物理规则的
几何结构增强了真实感。此外,该模型还能适应多种艺术风格,比如从梵高的画作到现代游戏场景,甚至可
以生成原画中没有的新内容。更重要的是,这项技术可以与其他AI工具结合,例如与文生图工具结合,实现
从文本直接创建3D世界的完整流程。研究团队认为,这项技术将彻底改变电影、游戏等领域的创作方式,为
创作者提供更丰富的工具和可能性。
随着大模型技术的快速进步发展,目前大模型技术的大规模商业应用亦在广告、电商、医疗、金融、智
能驾驶等行业逐步落地。如在生成式内容创作与广告营销领域,Meta和谷歌等厂商利用生成式AI自动生成高
质量广告文案、图像和视频,降低内容制作成本,并推动广告转化率提升;MayoClinic与StanfordMedicine
联合推出的多模态医疗诊断平台,通过融合CT影像、基因数据和电子病历,实现肺癌、脑肿瘤等疾病早期检
测,有效提升诊断准确率。
在国内,据中央网信办统计数据显示,截至2024年12月31日,共302款生成式人工智能服务在国家网信
办完成备案,其中2024年新增238款备案。依托国家政策支持和本土数据优势,大模型技术迅速在各行业落
地。如在政务与智慧城市领域,通过自然语言处理与图像识别,实现政务咨询、智能审批等功能,有效提高
办事效率,并实现人力成本压降;在电商领域,通过大模型技术帮助电商企业实现全链路智能推荐和客户行
为预测,提升客户转化率,助力实现销售目标。
当前,人工智能大模型产业正处于从基础研发向商业落地全面扩散的关键阶段。全球领先企业在Transf
ormer架构优化、多模态融合、智能代理及复合系统构建等方面取得了显著突破,而中国企业凭借本土数据
优势、政策扶持和低成本技术路径迅速崛起。未来,随着技术的不断迭代进步,大模型将实现更低能耗、更
高效率和更广泛的普惠应用,并成为连接数字与物理世界的核心枢纽,重构全球生产力范式。
二、报告期内公司从事的主要业务
本报告期,公司实现营业总收入56.6亿元,同比增长15.2%。整体毛利率达73.6%,继续保持在较高水平
。公司进一步开拓海外市场,收入继续保持积极增长态势。其中,海外信息分发与元宇宙平台Opera继续保
持高速增长,2024年实现营业收入4.8亿美元,同比增长21.1%;海外社交网络和短剧平台业务实现营业收入
12.5亿元,同比增长28.5%,综合推动公司海外业务收入规模至51.5亿元,同比增长21.9%,占总收入比重达
91.0%,为多元化AI产品矩阵的拓展奠定了坚实基础。本报告期,公司继续坚定践行“AllinAGI与AIGC”发
展战略,持续加大研发投入,全年公司研发费用为15.4亿元,同比增长59.5%。
公司AGI与AIGC业务商业化取得重要进展。AI社交报告期内单月最高收入突破100万美元,成为海外收入
增长速度最快的中国AI应用之一;截止2025年3月底,AI音乐年化流水收入ARR达到约1200万美金(月流水收
入约100万美金),短剧平台Dramawave年化流水收入ARR达到约1.2亿美金(月流水收入约1000万美金),进
一步加速AI商业化进程。
本报告期公司业绩阶段性承压,实现归属于母公司股东净亏损15.9亿元,同比转亏。具体来讲,为巩固
公司在AI领域的领先地位,报告期内研发投入进一步加大,产生的各项短期成本与相关支出在一定程度上影
响了本期利润表现;另一方面,投资收益表现亦不及去年同期,金融资产价格波动导致的投资相关损失8.2
亿元。以上两大因素综合导致本报告期业绩出现亏损。
我们认为在全球范围内,23-24年是AI大模型的初始投资期,全球各家科技公司在AI大模型上投资数百
亿美金都处于巨亏状态;25-26年是AI大模型的应用落地和收入增长期,这个阶段行业收入将快速增长但仍
处于亏损阶段;27年以后属于开始盈利期。针对昆仑万维自身,公司预计跟行业高度一致,预计27年开始AI
大模型业务将实现盈利。同时AI对公司是难得一遇的机会,即使短期面临亏损风险,公司也将坚定投入,保
持在AI大模型第一梯队。
报告期内公司主要业务:
1、AGI与AIGC业务
昆仑万维作为中国领先的人工智能科技公司,近年来在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏、
AI社交等多个领域取得了显著进展,构建了全面的AI业务布局。公司通过自研技术持续迭代“天工”系列大
模型,在复杂任务处理、多模态等方面实现多项突破,整体AI技术实力稳居行业第一梯队。公司自研的AI音
乐大模型达到行业SOTA,位居全球第一;公司开源的SkyworkR1V多模态思维链推理模型达到开源SOTA,位列
全球同类型开源模型第一;公司面向AI短剧创作的SkyReels视频大模型达到全球领先水平。此外,公司旗下
的大模型学习强化Skywork-Reward奖励模型亦达到全球第一,成为Kaggle官方推荐的数学rewardmodel。同
时,昆仑万维积极推动AI技术的普惠化应用,开源多项核心技术,赋能全球开发者与用户,为全球AI生态建
设不断贡献力量。
1.1AI大模型
昆仑万维自布局AI大模型领域以来,始终致力于推动技术创新与行业应用。公司目前已经构建了从基座
模型到多模态交互系统的全栈技术体系。通过持续迭代“天工”系列模型,昆仑万维在复杂任务处理、推理
效率及用户体验等方面实现了多项突破,逐步确立了在国内AI大模型领域的头部地位。
2024年,公司在人工智能大模型领域持续深耕,围绕混合专家模型(MoE)架构、推理能力优化、实时
语音交互及多模态技术展开全面创新,持续迭代“天工”系列模型,并公布多项核心技术,为行业树立了新
的技术标杆。
在模型迭代方面,公司于2024年2月6日发布了基于混合专家模型(MoE)架构的“天工2.0”。该模型通
过动态任务分配机制,将输入数据分派至不同专家模块处理,显著提升了复杂任务处理能力与推理效率。相
较于传统稠密模型,“天工2.0”凭借稀疏激活机制降低了计算资源消耗,响应速度大幅提升,同时通过增
加专家模型数量、调整专家模型的权重配比实现较强的可扩展性,为后续技术升级奠定了基础;2024年4月1
7日,公司进一步推出“天工3.0”,其参数规模达到4000亿,超越同类开源模型,成为当时全球最大的开源
MoE模型之一。该版本在语义理解、逻辑推理及代码生成等领域的综合性能较前代提升超30%,尤其在数学与
文创任务中表现亮眼;2024年11月,公司发布了“天工4.0”系列模型。该系列包含4o版与o1版两个版本,
其中,“4o版”专注于实时语音交互系统,通过端到端自研技术实现了接近人类响应时间的低延迟对话,支
持全双工交互与多语言无缝切换。该版本还引入了情感理解功能,能够识别用户情绪并生成拟人化回应,同
时开放音色与风格定制功能,显著提升了用户体验;而“o1版”作为国内首款具备慢思考推理能力的模型,
通过分阶段训练(包括反思训练、强化学习及规划算法优化)大幅增强了复杂问题处理能力。其在数学竞赛
、密码解密及逻辑陷阱问题中的表现超越主流模型,评测指标达到同生态位顶尖水平。
在开源社区建设方面,2024年6月公司正式开源Skywork-MoE稀疏大模型,该模型通过MoE架构和ExpertD
ataParallel等优化策略,有效降低推理计算量并保持高性能。2024年末,公司进一步推动开源进程,正式
将Skyworko1Open模型全面开源,作为国内首款具备慢思考推理能力的开源模型,Skyworko1通过自研的多阶
段训练方案(包括反思训练、强化学习及规划算法优化),显著提升了复杂任务处理能力。其开源版本基于
轻量级架构设计,支持开发者针对分步推理任务进行优化,填补了代码类任务的开源工具空白。Skyworko1
的开源,不仅降低了行业技术门槛,还吸引了全球开发者参与生态共建,推动了AI技术的普惠化与商业化应
用。2025年3月,公司开源了SkyworkR1V多模态思维链推理模型,成为中国首家开源多模态思考模型的企业
,并达到业界SOTA。该模型通过三阶段混合训练框架,将文本端顶尖推理能力无缝迁移至视觉任务,在MMMU
、MathVista等评测中性能比肩甚至超越更大开源模型以及主流闭源模型,树立“小体积、大智慧”的新范
式。同时,公司还针对大模型强化学习中的核心组件奖励模型展开技术攻坚,并于2024年9月发布了Skywork
-Reward-Gemma-2-27B和Skywork-RewardLlama-3.1-8B两款奖励模型。区别于传统奖励模型,Skywork-Rewar
d奖励模型的偏序数据仅来自于网络公开数据,并采用特定的筛选策略,以获得针对特定能力和知识领域的
高质量的偏好数据集,并通过微调与再平衡实现性能提升。凭借卓越的技术能力,两款模型在权威奖励模型
评估基准RewardBench上表现卓越,达到行业SOTA水平,总下载量近70万,获得了官方及社区的高度认可。
此外,公司还积极同外部机构合作,共同推动开源社区发展,促进AI技术进步。2024年4月,公司与新
加坡国立大学、新加坡南洋理工大学联合发布Vitron通用像素级视觉多模态大语言模型,在图像与视频的理
解、生成、分割及编辑等任务上实现统一处理,为更全面的视觉大模型应用提供了新思路;2024年6月,公
司与新加坡南洋理工大学合作推出Q*推理算法,令较小规模模型在GSM8K、MATH及MBPP等测试中展现出接近
甚至超越更大模型的表现;2024年10月,公司又与北京大学合作研发了“MoE++”框架。该框架通过引入“
零计算量专家”,动态调整激活专家数量及跨层路由路径整合,将吞吐效率提升1-2倍,路由稳定性显著提
高。公司通过实际行动,坚定践行开源承诺,共同塑造更具活力和创造力的开源生态。
1.2AI搜索
昆仑万维作为人工智能领域的创新引领者,于2023年8月率先推出国内首款AI搜索产品——天工AI搜索
,开创中国AI搜索先河。基于自研千亿级参数大语言模型,历经多轮技术迭代与功能拓展,天工AI搜索已经
从最初的AI搜索工具不断迭代升级,逐步发展为覆盖多场景综合性AI智能助手。
本报告期,公司继续以“天工AI智能助手”为主要载体,持续推进技术创新与产品迭代,在AI搜索、多
模态交互及用户生态建设等领域取得显著成果,逐步构建起覆盖多场景的智能化服务体系。报告期内,“天
工”峰值日活跃用户超过100万,峰值月活跃用户突破1000万。
2024年2月,公司正式发布首个搭载MoE架构的千亿级参数大语言模型AI应用——“天工AI智能助手”,
面向全体C端用户免费开放。此次更新全面升级了AI搜索、对话、阅读与创作功能,支持最高100K超长上下
文窗口(约15万汉字),并引入多模态能力,实现图文对话、文生图等交互场景。用户可通过自然语言指令
获取图文并茂的答案,显著提升信息呈现的直观性。
2024年4月,天工AI智能助手增加多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩
图等核心功能。其中,研究模式可自动生成研究大纲、思维导图等结构化内容;增强模式通过追问与信息补
全机制,显著提升复杂问题的处理精度;改图扩图功能支持图片尺寸扩展与定向调整,多模态性能显著提升
。
下半年,天工AI智能助手再次升级,推出高级搜索模式,并大幅提升文档分析能力,进一步优化用户搜
索与知识管理体验。高级搜索模式深度整合国内外权威领域的海量专业型数据资源(涵盖学术论文、研究报
告、财报、研报等),通过路径规划与多轮执行机制,为复杂问题提供全面解答。答案以图文并茂形式呈现
,结合文字、图表及图片,帮助用户直观理解数据与概念。例如,用户搜索研究某个行业发展趋势时,系统
将自动解析多份行业报告,生成包含市场规模、竞争格局、政策影响的可视化分析,为用户提供真正有价值
的解答。同时,升级后的文档分析功能具备精准的文字理解与超强上下文处理能力,支持500K字超长文本。
通过自研PDF解析引擎与文档解析大模型,天工AI智能助手在多列文档、分页换行等复杂场景中表现卓越,
达到SOTA(StateofTheArt,当前最佳水平)。其新增的深度解析、多模态输出等功能,支持对学术论文、
财报、研报等应用场景的精准分析与问答。用户可通过悬浮窗或直接上传PDF使用,享受跨文档摘要、脑图
生成等高效分析体验,显著提升信息获取效率与准确性。
2024年末,公司重磅推出基于天工大模型4.0(Skywork4o)构建的实时语音对话助手“Skyo”。通过端
到端多模态建模技术,Skyo突破传统语音助手延迟高、交互生硬的瓶颈,实现“真人级”对话体验,并具备
主动交流与长时记忆能力,覆盖情感陪伴、多语言客服、资讯播报等场景。目前,Skyo已经上线,用户只需
通过语音输入问题或指令,Skyo即可在1秒内响应,支持多语言对话与情感化回复。此外,Skyo支持声音风
格定制,用户可选择专业播报或轻松闲聊等不同音色,满足个性化需求。
(天工官网链接:https://www.tiangong.cn/)
1.3AI短剧
人工智能技术正以前所未有的速度重塑内容创作与娱乐产业的未来。在短视频内容消费升级的浪潮中,
昆仑万维正以前瞻性的AI技术布局,引领全球短剧行业进入普惠创作时代,为海外数字内容市场注入可持续
的增长动能。公司聚焦“创作赋能+内容分发”双轮驱动战略,致力于打造海外市场的短剧领域新生态。通
过AI大模型技术的深度赋能,为全球用户搭建低门槛内容生产环境,形成从内容创作到内容消费的正向循环
。
在内容创作方面,2024年8月,公司推出全球首个集成视频大模型与3D大模型的AI短剧创作平台——Sky
Reels,实现从剧本构思到角色设计、从场景合成到影片生成的全流程自动化创作,有效降低专业级短剧创
作门槛,让创意灵感轻松转化为高质量短剧内容。
SkyReels平台集成了昆仑万维自研的多个大模型技术。首先,SkyScript剧本大模型通过强大的剧本生
成能力,支持快速创作结构完整、情节丰富的短剧剧本。其优化的爽点生成能力,使得生成的剧本在人工评
估中能够获得高分。其次,StoryboardGen分镜生成大模型利用分镜师的专业经验和上下文增强技术,提升
了分镜的连贯性和故事呈现能力,确保了创作的视觉表达准确无误。此外,Sky3DGen大模型支持生成多样化
的3D元素和场景,并具备实时的3D场景交互能力,进一步提升了创作效率。最为创新的是WorldEngine,它
将AI3D引擎与视频大模型深度融合,打破了传统视频创作中物理现象不协调的问题,成功实现了物理模拟与
幻想创造力的精确融合。
本报告期,SkyReels持续迭代模型能力,在视频生成各环节均取得显著进展。首先,剧本生成模块新增
海量爆款创意模板,AI生成能力大幅提升,短剧“爽点”生成效果尤为突出,人工评级稳定达到A/S级;角
色库引入写实AI演员并配备细粒度属性标签,可智能匹配剧本人设。分镜生成系统融入专业经验,显著提升
连贯性与人物一致性;视频生成采用分级模型策略,结合不同镜头类型动态调用参数量级,显著提升创作效
率。同时,通过构建情感音色库和短剧BGM库,实现角色与场景音频精准匹配,强化情感表达。
其次,平台还推出多项创新功能优化创作流程。在Web端,新增3D交互编辑功能实现分镜画面与人物实
时调整,提升创作精度;全新AI动捕功能突破条件限制,用户只需使用任意摄像头或视频,即可驱动AI演员
表演,极大提升了人物表演的可控性;平台还集成百万级影视动作数据库并开放自定义功能,结合新增演员
衣橱系统,支持服装设计与分镜场景统一,人物定制能力全面升级,确保分镜与成片形象一致性,最终实现
短剧质量与创作自由度的双重跃升。
此外,为有效地降低AI短剧创作成本,推动AI短剧生态发展,公司于2025年初开源了中国首个面向AI短
剧创作的视频生成模型SkyReels-V1和首个SOTA(StateofTheArt,当前最佳水平)级别的表情动作可控算法
SkyReels-A1。SkyReels-V1专注于人物表情、肢体动作及场景的精准控制,支持33种细腻表情与400+种自然
动作组合,其自研推理框架SkyReels-Infer优化了生成效率,并支持多卡并行与低显存优化,大幅降低技术
门槛与成本。SkyReels-A1则专注于高保真表情与动作生成,支持任意人体比例的动态视频生成,精准还原
微表情与表演细节,避免人物失真,在复杂表情与大幅度动作生成上表现出众。截至2025年2月末,V1模型
在HuggingFace的下载量已接近3万次,在Github亦收获逾千星的点赞,广受好评。
在内容分发方面,公司于2024年下半年推出DramaWave短剧平台,通过推出“付费+免费”内容分发模式
,精准覆盖不同消费层级的全球用户群体,成功构建了多元化短剧内容生态。DramaWave以高品质原创短剧
为核心,提供1080P高清画质与多语言字幕支持,通过精准算法推荐机制,为用户打造沉浸式观剧体验。其
订阅模式不仅确保了内容的持续更新,更为创作者提供了稳定的收益保障。DramaWave涵盖丰富多样的短剧
类型,从浪漫爱情到悬疑惊悚,满足用户碎片化时间的娱乐需求。目前AI短剧业务已形成包括订阅、内购及
广告等形式在内的多元化收入来源,截至2025年3月底,Dramawave年化流水收入ARR达到约1.2亿美金(月流
水收入约1000万美金),为短剧内容生态的持续发展提供了强劲动力。
另据第三方数据显示,截至2025年3月,DramaWave月活跃用户量已突破1000万大关,用户规模成功跻身
行业前五,稳居出海短剧赛道第一梯队。平台旗下爆款短剧《订婚风暴》表现强劲,上线仅5天播放量便突
破千万大关。在该剧的推动下,DramaWave自4月5日起成功跻身韩国GooglePlay娱乐应用榜TOP10,并持续逼
近长期占据领先地位的Netflix。随后,其市场表现进一步攀升,于4月12日登顶该榜单榜首,并连续霸榜四
天,实现在韩国市场对Netflix的超越。
1.4AI音乐
公司推出的天工SkyMusic是国内首款且唯一公开可用的AI音乐生成大模型。自模型推出以来,公司不断
推动AI音乐生成技术的应用,从音乐创作工具到商业化产品的发布,均取得了显著进展。在模型迭代方面,
最初的天工SkyMusic模型(后来更名为Mureka大模型)通过采用类Sora架构和Large-scaleTransformer技术
,实现了一体化端到端音乐生成。特别是在音质和人声合成方面,取得了显著突破。随着技术的不断发展,
SkyMusic2.0应运而生。相比于初版,SkyMusic2.0凭借自研DiT架构,在音乐旋律、结构完整性、配器丰富
度等维度均有大幅提升,在人声音质、自然度和发声可懂度上保持行业SOTA(StateofTheArt,当前最佳水
平)。
2025年3月,公司正式推
|