新赛道 | 启明星辰发布“大模型访问脱敏罩”,客户安心面对DeepSeek引爆的访问安全刚需
启明星辰已于两周前发布了“大模型应用安全新三件套”,确立了大模型应用安全的三大支柱:服务侧防护、访问侧保护、保障侧支撑。
3月3日,启明星辰发布大模型访问脱敏罩MADA Mask(Model Application Desensitization Access Mask),为访问侧、用户应用侧提供了更专业的数据脱敏防护。MADA Mask重点解决机构对外访问开放大模型的时候避免自身敏感数据泄露的安全问题。一个机构如果想要全员充分应用共有大模型,同时还要保证机构敏感数据不被泄露,MADA Mask就是快速直接的解决之道。

MADA Mask通过在企业用户与大模型应用之间的数据交互过程中,对输入、输出内容及上传文件内容进行实时识别、脱敏和行为阻断管理,有效防范数据泄露风险。确保在敏感信息进入大模型前进行脱敏处理,并在输出时进行二次检查,防止任何潜在的敏感数据暴露。确保企业能够在使用大模型强大能力的同时,保障数据安全,降低合规风险,提升整体数据治理水平。
DeepSeek企业级场景下数据交互的一些核心威胁
大模型(如DeepSeek、豆包、通义千问等)的推理、解读分析能力在企业、政府、医疗等领域的应用日益广泛,而这些领域对于敏感数据、隐私数据、秘密数据的保护需求非常高。但机构内用户在输入或上传的数据是(提示词、文字信息,附件的文件、文本等)可能包含个人隐私、企业敏感信息、医疗健康数据等敏感内容,若未脱敏直接输入大模型,可能导致以下风险:
数据泄露:大模型的训练或推理过程可能记录敏感信息,通过模型输出、缓存或第三方接口间接泄露。
违规利用:威胁者可能通过“提示词注入”诱导模型返回敏感数据,或利用大模型生成伪造内容(如虚假公文、医疗报告等)。
合规风险:违反《数据安全法》、《个人信息保护法》等法规,面临巨额罚款与法律责任。
因此,需要MADA Mask在企业/用户与大模型之间建立“数据脱敏缓冲区”,实现数据脱敏、秘密阻隔,在保障数据真实价值的同时系统性降低数据泄漏风险和保障数据安全与合规。
机构都在斟酌几种典型的DeepSeek使用部署安排
DeepSeek爆火之后,所有拥有潮流敏感度的机构都已经启动了全面应用DeepSeek(和其他大模型)的安排。现在看到四个典型的使用部署安排:
第一种是全私域部署,即在机构内部部署满血DeepSeek或其他全功能大模型。这样机构内部使用大模型,数据泄露的直接风险相对不高(当然并非没有);但是机构的投入成本相对较高。
第二种是公共大模型访问开放部署,即机构为内部员工自由访问外部大模型。这样机构的投入最少、起步最快;但是,数据泄露风险暴露面最大,最危险。
第三种是公共大模型访问罩部署,即机构为内部员工访问外部大模型提供一个访问代理,并同时安排数据安全和其他应用安全保护。这样可以在极少的投入下,让机构全员能够获得大模型应用的收益。这种部署方式和前两种部署方式并不互斥。
第四种是混合大模型访问体系化部署,即基于AI-R-IAM身份管理、业务分割、网络分域、数据分域的复杂部署方式。这种部署模式适用于大型机构的深度应用环境。
而对于最大多数的机构来说,最快的风险也较低的快速使用部署安排,第三种公共大模型访问罩部署;就是鼓励所有员工、所有部门都以松散的方式访问公共大模型服务,在机构边界或云上部署MADA Mask大模型访问脱敏罩。
MADA Mask使用场景的角色体验和价值
我们可以从两个角色体验,看看MADA Mask的安全价值。
1.机构内的普通大模型访问者的体验
角色:企业员工、业务部门用户等需通过大模型完成日常任务的人。
核心需求:
(1)无感知脱敏:在正常使用大模型(如数据分析、报告生成)时,无需特意手动处理敏感信息,系统自动完成内容脱敏。
(2)效率保障:脱敏过程不影响工作流程,上传文件或输入文本时实时处理,避免因安全操作导致任务中断。
(3)结果可信度:脱敏后的模型输出需保留业务价值(如统计趋势、逻辑结论),避免因过度脱敏导致信息失真。
典型使用场景示例:
市场部门员工:上传包含客户信息的市场调研报告,系统自动隐去客户姓名、联系方式,仅保留行业、规模等非敏感字段供模型分析,生成市场策略建议。
2.机构内的数据安全管理者的体验(机构领导特别关注的效果)
角色定位:企业CSO、数据合规官、IT安全团队等负责全局数据安全的决策者和运行者。
核心需求:
(1)全链路可视性:从数据输入到模型输出的全流程监控,确保敏感信息“零暴露”。
(2)灵活策略管理:根据业务场景动态调整脱敏规则(如按部门、数据类型、模型类型定制策略)。
(3)审计与溯源能力:系统记录所有数据交互行为,支持快速定位风险并满足合规审计要求。
(4)根据业务的发展以及脱敏保密要求的变化,相关的规则和策略可以不断升级迭代。
典型使用场景示例:
数据安全管理者的一天
(1)上午:查看仪表盘中的“昨日风险摘要”,发现客服部门有3次未脱敏对话记录,通过日志溯源定位到新员工操作失误,立即推送培训通知。
(2)下午:收到系统自动生成的《季度合规报告》,直接提交给法务团队用于外部审计。
(3)傍晚:根据“威胁热力图”发现某部门xx敏感词频次上升,调整脱敏策略,将“部分掩码”升级为“全文替换为模拟数据”。
核心能力
1.敏感数据智能围栏
系统运用多模态识别引擎技术,能够快速扫描上传文件与输入内容,无论是身份证号、银行卡号等常见个人信息,还是企业合同中的商业信息,都能精准定位,同时支持金融、医疗等行业定制化规则库。首创【脱敏缓冲区】技术,对需保留语义的敏感信息(如合同关键条款)实施动态替换,实现数据可用性与安全性的平衡。
2.数据脱敏技术
系统采用了数据替换、数据加密、数据泛化、数据扰动、数据删除等技术手段,能够根据数据类型和业务需求,灵活制定数据脱敏规则,在确保用户输入和上传文档中的敏感数据安全脱敏的同时,也不影响大模型分析使用。由于数据脱敏之后可能会导致可用性下降,影响模型训练或推理效果。因此,采用了数据脱敏增强技术,充分利用生成对抗网络GAN、变分自编码器VAE等技术生成与敏感数据相似的合成数据,再通过上下文补全技术,利用行业知识库和语言模型,恢复因为脱敏后导致的语义缺失,有效弥补数据脱敏过程中丢失的信息,提升大模型的训练效果。
3.内容智能阻断
系统运用先进NLP技术与算法,对每一次输入至大模型的内容展开实时且深度的扫描,一旦精准检测到高风险敏感信息,便毫秒级触发内容输入阻断功能。该功能如坚固壁垒,拦截敏感内容,从源头杜绝数据泄露风险,高效可靠地守护数据安全,防范数据泄露,筑牢安全防线。
4.全链路审计
系统构建了大模型访问过程中全链接的审计体系,对每一个细微操作均予以精确记录,从而生成详尽且具有极高价值的行为审计日志。从文件上传的初始瞬间,到输入内容提交的关键节点,再到脱敏处理的核心环节,全流程中的每一个操作,无论是操作发生的精准时间,执行操作的具体人员,操作所涉及的详细内容,还是操作最终产生的结果都被记录。一旦出现安全问题,可通过审计日志快速追溯,查明原因,为安全改进提供依据。
典型部署方式
方式1,本地网关形态:MADA Mask逻辑串行部署于企业网络边界出口,覆盖公域大模型服务(如DeepSeek、通义千问等)和私域大模型,提供智能化数据脱敏服务,让用户安全上传数据。
方式2,SAAS化代理网关形态:MADA Mask逻辑串行部署于公有云上,覆盖公有云SAAS化大模型服务(如DeepSeek、通义千问等),提供智能化数据脱敏服务,让用户安全上传数据。

典型行业应用场景
1.医疗行业
病历文件上传场景:医院在进行科研项目、远程医疗会诊等工作中,可能需要将患者病历上传至大模型进行分析。系统对病历文件中的患者姓名、身份证号、医保卡号、详细病史等敏感信息进行精准脱敏,确保患者隐私安全。
临床诊断辅助场景:辅助临床诊断时,医生输入患者症状描述等数据上传大模型时,系统即时对文本中的敏感信息脱敏,避免患者隐私泄露。例如,将具体家庭住址模糊化处理,仅保留所在区域信息,为大模型提供安全可用的数据,助力精准诊断。
医疗大数据分析场景:医疗机构利用大模型对海量医疗数据进行分析挖掘,以发现疾病流行趋势、优化治疗方案等。系统在数据上传至大模型前,对数据进行严格脱敏,确保原始患者数据的隐私,同时满足数据分析的要求。
2.政府行业
快速办公场景:在处理各类行政审批、政策调研等工作时,会收到大量企业和公民上传的文件,如企业财务报表、个人申请材料等。系统可在文件上传入口处自动识别敏感信息,如身份证号、银行账号等,采用掩码、替换等方式进行脱敏处理,确保在后续大模型分析过程中敏感信息不被泄露。
深度应用场景:政府不同部门间常需共享数据并借助大模型进行联合分析。系统可在数据共享前,对共享数据进行全面脱敏。例如,统计部门在获取人口数据用于宏观分析时,可对姓名、家庭住址等敏感信息进行深度脱敏,仅保留年龄、性别等汇总分析所需的非敏感信息,既满足业务需求又保障数据安全。
3.商业企业
二次分析场景:在企业内部,客户资料、财务报告、HR资料文档可能包含员工薪资、客户敏感信息等内容,上传文档到大模型时,系统自动扫描文档,识别敏感信息进行脱敏处理,确保敏感信息不被随意泄露。
营销策略场景:CRM系统中存储了大量客户信息,包括客户联系方式、购买偏好、消费金额等。在利用大模型分析客户行为、制定营销策略时,系统对上传的客户数据进行脱敏。例如,电话号码进行掩码处理,消费金额按照区间划分,既能保护客户隐私,又能让大模型通过脱敏后的数据挖掘客户潜在需求,优化营销方案。
启明星辰大模型访问脱敏罩(MADA Mask)努力实现“对话的安全可信”,通过输入控制、数据脱敏、文件脱敏等核心技术融入最典型的大模型应用访问场景,构建简单快捷,实现了“人-模交互”中业务价值与数据可信保护的平衡,重新定义了AI时代的安全交互范式,确保AI应用场景下的数据安全与合规性,推动智能交互迈向更高层次的安全与信任。
(转自:启明星辰集团)