对话绿盟科技CTO叶晓虎:大模型不是安全产业发展的终点

http://ddx.gubit.cn  2023-10-25 20:18  绿盟科技(300369)公司分析

本报记者 谭伦 北京报道

诞生逾半年后,生成式AI在网络安全领域的应用正在成为趋势。IDC报告指出,生成式 AI对网络安全的影响巨大,通过AI和自动化技术实现安全运维,已成为近年来产业持续探索的方向,而大模型的出现,将对耗时耗人的安全运维产生巨大变革。

受此风潮推动,全球科技巨头都在积极探索安全场景下的大模型落地。《中国经营报》记者注意到,在微软、谷歌两大巨头于年初率先推出安全大模型后,行业厂商积极跟进。在海外,以Palo Alto Networks、CrowdStrike等厂商为代表,而在国内,近半年来,包括绿盟科技在内的主流网安企业都已发布安全大模型应用。

“AI技术在网络安全领域其实一直都有应用,但是大模型的出现,在范式上给网络安全产业带来了一些变化。”绿盟科技CTO叶晓虎近日接受《中国经营报》记者采访时表示,目前包括分析研判、自动化生成规则、快速响应和处置等基于安全大模型的特殊场景都已进入企业安全应用层面,并收获良好成效。

此前9月初,绿盟科技正式推出风云卫安全大模型,宣布将进一步提升智慧安全3.0能力。对此,叶晓虎告诉记者,安全领域有些问题的边界条件非常明确,采用现有成熟的AI技术即可,因此没有必要重复造轮子。但此次发布大模型,不是为了跟风,而是考虑如何更好融合大模型,结合过去已有的行业知识图谱,在不同安全场景下,实现一些AI算法模型的集合,以此来解决一些边界更大的特定问题,提高效率。

大模型无法解决所有问题

对于当前开发安全大模型过程需要解决的首要挑战,叶晓虎指出,搜集语料是需要最先面对的问题。“知识管理原本就是特别复杂的过程,而安全行业这么多碎片知识积累起来,本身也是一个非常漫长的过程,所以快速积累非常重要。”

OpenAI公布的公开数据显示,2018年6月推出GPT-1时,OpenAI投喂了5GB的预训练数据,参数量达1.17亿;2019年2月发布GPT-2时,预训练数据为40GB,参数量达15亿;到2020年5月推出GPT-3,则使用了45TB的预训练数据(3000亿语料),参数量达1750亿。截至目前,ChatGPT已经发布到4.0版。

“和通用大模型一样,安全大模型语料消耗的量巨大,速度也非常快。”叶晓虎表示,我们自己研发大模型时,哪怕已经做了20年,但为了大模型去收集各种语料时,仍感觉到非常困难。

而问及目前商业落地过程中,安全大模型将会更聚焦于场景还是行业时,叶晓虎向记者回应称,如果从实战对抗角度看,场景是安全大模型的首要因素。“我们还是希望技术应用有对应的实战效果,要针对某一类具体场景,而且我们要验证它确实具备解决这些问题的有效性,以及消耗合适的成本。”他表示。

在此背景下,叶晓虎坦言,站在通用网络安全应用的角度来看,其实目前不同行业间的差别并不明显。在其看来,有的行业客户IT成熟度、安全成熟度水平高,有的行业相对差一些,但大家面临的安全问题很多是通用的。在其20多年的从业经验中,当年的有些问题在20年前与今日差别不大,只不过应用场景、现实条件发生了很多变化。

此外,对于业内对安全大模型的期待,叶晓虎也进行了适当“降温”。“讲到安全,大家不要寄希望于有了一个大模型,就不用再管任何问题了,不是这样的。”他表示,安全领域只存在特定技术解决特定问题,无法做到一种技术包治百病。

安全产业发展没有终点

据不完全统计,截至今年9月底,我国已经发布了逾百个行业AI大模型,百模大战态势如火如荼。竞争激烈的背后,则是大模型正向千行百业的垂直领域下沉,安全行业亦不例外。

复杂的场景与多变的需求之下,安全大模型服务于企业市场时,如何兼顾由此带来的通用性与定制化需求差异,成为摆在安全企业面前的一大难题。

对此,叶晓虎表示,通用的安全需求仍是最主要的考虑事项,但在不同的场景中,大模型的部署和业务,包括成熟度,会存在参数的不同。“这是安全行业的现状。”叶晓虎通俗地解释称,企业对于安全需求的本质其实就是三件事——资产、威胁、脆弱性。只不过在金融行业,其表现主要聚焦在云机房,而在能源行业中,还需要考虑到边缘计算。

“我们后续在AI持续发展计划方面一个很重要的思路,就是‘共建生态’。”叶晓虎表示,从安全公司角度来讲,要提供一个技术手段,用自己掌握的数据,训练相应的模型,而在客户的应用现场,可以更新调整这一模型,这是绿盟目前在做的重要工作。

据其介绍,以云端为例,安全大模型会首先生成一个特定模型,落地到客户现场,对接用户相应的安全系统,随后其产生的数据,结合绿盟的通用安全大模型,再重新生成客户适用的大模型。不过,从AI工程化到软件的实现,以及算力的优化,目前还有很多工作要做。

而对于定制化,叶晓虎认为,一定要通过配置化去解决。“要不然每个企业都重新做,那是不现实的。”他表示,就跟安全大模型一样,通用的语言大模型我们肯定不会再重新做一遍,在已有基座上,结合我们对安全方面的理解做工程化、做算力优化、做安全知识积累、做算力调度模型,最终生成我们自己的模型。

最后,叶晓虎表示,以往业界常说,一项新技术出现后,市场往往总是高估了它的短期效益,而低估了长期的影响。在其看来,这句名言也同样适用于评价AI大模型。

“目前AI大模型的出现,在安全产业的发展中只是一个新阶段,但肯定不会是最终形态。”叶晓虎最后强调,安全产业的发展没有终点,AI在安全领域的应用还有很长的路要走。

(编辑:张靖超 校对:颜京宁)