基于DeepSeek,山东能源云鼎科技打造垂域矿山大模型!
近日

成为科技圈顶流
开启了低成本探索AI的新阶段
标志着AI大模型正式步入
"低成本、高精度、全开源"的普惠时代

云鼎科技第一时间
接入DeepSeek
凭借在矿山、化工行业
积累的海量数据优势
蒸馏出首个垂域矿山大模型
目前已全面接入
山东能源集团知识助手
DeepSeek-R1+数据蒸馏
构建垂域矿山大模型
在矿山智能化领域,云鼎科技积累了多年的矿山行业知识、经验,覆盖安全生产、设备管理、应急救援等关键业务场景的百万级高质量数据资源,为构建垂域矿山大模型提供了数据蒸馏基础。
通过数据蒸馏技术,云鼎科技采用DeepSeek-R1作为教师模型,对高质量矿山数据进行数据蒸馏,获得矿山行业的高质量思维链(COT)数据。利用高质量COT数据对自有模型进行微调,将教师模型(DeepSeek-R1)的输出与学生模型的输出的差异通过损失函数进行度量,通过这一损失值指导学生模型反向传播过程,从而实现参数的优化。
通过这种方式,学生模型能够学习到教师模型的高级特征表示,达到或接近教师模型的性能水平,从而显著增强自有模型在矿山行业中的推理能力,最终蒸馏出首个基于DeepSeek-R1的垂域矿山大模型。在降低算力消耗的同时,使更小参数的模型获得更加高效、精准的推理能力,应用于山能知识助手中,经测试,安全生产知识场景中对话问答准确率达96%以上。
NLP 应用智能体
打通应用落地“最后一公里”
只有垂域矿山大模型还不够,真正深入核心业务环节还需要链接应用,基于这个需求,云鼎科技打造了NLP应用智能体。智能体具备知识管理、工作流编排、应用构建、知识运营等核心功能,可为客户提供灵活的知识问答编排框架和应用模版,快速构建知识问答应用、工作流应用、智能体应用。DeepSeek的完美接入,让应用效果大幅提升。

同时,NLP应用智能体还打通从数据处理、模型微调到应用开发全链路。将业务数据与DeepSeek深度结合,支持40+数据预处理算子自由编排,将企业业务数据转换为高质量元数据用于模型微调,注入专业领域知识,最终获得私有垂域模型。
NLP应用智能体
提供知识问答应用
解决大模型“幻觉”问题
采用端到端自研的RAG架构
内置中文增强的向量化模型
(Embedding模型)
与重排序模型
(Reranker模型)
辅以混合检索与多源融合排序
有效提升知识检索精度
中文领域端到端检索精度超过90%
工作流应用
基于AWEL
(Agentic Workflow Expression Language)
支持10+内置组件以及自定义组件
客户可根据业务逻辑构建工作流
降低开发门槛、提高开发效率
智能体应用
基于指令遵循
Function Calling、任务拆解等能力
具备多智能体协同
自定义工作流工具导入
实现“一键”应用开发
云鼎场景+定制化服务
赋能行业数智化升级
云鼎科技垂域矿山大模型的应用,解决通用大模型无法理解矿山行业知识的问题,并且通过NLP应用智能体,在安全生产、运营管理、财务审计和辅助决策等多个业务场景实现落地。
利用向量数据库存储大量的矿山行业数据,结合检索增强生成技术(RAG )提升回答准确率。在专业的安全生产场景中,云鼎科技打造煤矿安全生产知识助手,支持用户通过自然语言快速精准获取安全生产、生产数据、设备信息、创伤急救等知识,煤矿安全生产信息获取效率提升80%以上,设备故障排查和处置知识传递效率提升70%以上。
在通用的智能办公场景中,云鼎科技打造智慧办公助手,用户可以通过对话问答,快速获取规章制度信息、办公数据、公文信息等,实现“文档撰写过程更清晰、数据分析预测更准确”,整体办公效率提升20%以上。

下一步,云鼎科技将持续深化与DeepSeek等AI大模型的融合,依托“行业数据+大模型能力+场景经验”三位一体的核心优势,打造差异化的本地部署解决方案。针对矿山、化工、电力、钢铁、油气等行业对数据安全和私有化部署的强需求,提供模型部署、应用开发、场景方案定制、场景效果优化、系统运营运维的端到端一体化服务,以技术创新推动业务发展,赋能行业迈向智能化新时代。
作者 | 李冬厚 刘强 张财 王海涛
(转自:山东省煤炭行业协会)