工商银行吕仲涛:如何推动AI大模型在金融行业落地应用?

http://ddx.gubit.cn  2023-09-12 18:01  工商银行(601398)公司分析

近日,中国工商银行首席技术官吕仲涛“2023中国智能金融论坛”上发表题为《金融行业AI大模型落地探索与实践》的主题演讲。

吕仲涛表示,人工智能大模型技术具有广泛的应用前景,通过大模型可以推动数据与实体的融合,改变行业发展格局,但目前国内大模型在应用层面仍处于起步阶段。他指出,商业银行可以持续加大新技术面向全业务流程的综合化运用,全方位提升银行服务的工作质效。同时,他认为,大模型技术受制于各类因素,存在各类安全风险,落地需要大数据、大算力、大合作、大创新。针对大模型技术落地问题,他建议在四个方面加强建设,一是场景方面,金融行业需持续加快千亿级大模型场景建设;二是数据方面,需持续完善大模型数据工程建设;三是工程化应用方面,需持续提升大模型工程化流水线能力;四是评测标准方面,需建立金融行业大模型评测标准体系。

随着ChatGPT的发布,人工智能大模型技术成为社会各界关注的热点。ChatGPT的诞生,成为了AI界的"iPhone时刻",其出色的对话能力让其成为历史上用户增长速度最快的应用。ChatGPT在语言理解、知识储备和回答问题等方面,都展现出了很强的能力和潜力。同时让业界看到大模型广泛的应用前景,通过大模型可以助力行业提质增效,推动数据与实体的融合,改变行业发展格局。结合论坛主题,我主要和大家分享一下AI大模型在金融行业的落地探索与实践。

国际人工智能权威杂志《自然-机器智能》将大模型定义为网络参数规模达到亿级以上的“预训练深度学习算法”。大模型通过海量数据的训练学习,具备了强大的语言理解和表达、思维链推理等能力,在文本图像理解、内容生成等AI任务表现出显著优势和巨大潜力。相较于传统人工智能算法一事一议的建模方式,大模型具备更强的通用能力,可处理多种任务,可较好解决传统模型的碎片化问题。其特点可以总结为“三大一快”。三大,指的是大模型基于“大算力+大数据+大算法参数网络结构”进行训练,实现通用海量知识预置。一快,指的是大模型通用能力强,各行业可在大模型基础上,直接使用或“站在巨人肩膀上”通过再次训练快速学会新知识,快速赋能业务应用。

人工智能在1956年达特茅斯会议上被首次提出后,历经三次发展浪潮,其中人工智能第一、二次浪潮是“小数据、单任务”范式的分析式AI,分别是“专家系统+机器学习”浪潮以及深度学习浪潮,这两个阶段,人工智能技术均不能创造新内容。大模型催生了人工智能第三次浪潮,开始向“大数据、多任务”范式的生成式AI迈进,具备更强的通用性、理解和生成能力,让通用人工智能发展迎来起点,加速通用人工智能走进现实,改变人类的生产生活。

从ChatGPT诞生以来,国内外大模型发展浪潮持续高涨,形成了算法研发、产品应用的产业链生态。但相较国际领先水平,国内大模型仍存在代际差距。从算法生态来说,目前最优秀的大模型是OpenAI的GPT-4,这是一个多模态大模型,在很多领域专业和学术基准上表现出人类水平。国内各类AI公司也纷纷入局,已推出如百度文心一言、阿里通义千问、讯飞星火等产品,各有千秋。从应用层面来说,微软依托投资GPT4红利,已在搜索、办公、安全等传统领域推出智能化产品。国内在应用层面仍处于起步阶段,有待进一步探索。

大模型作为一种新型的人工智能技术,与传统模型相比,具备强大的通用能力和智能创作能力,可以通过聊天交互模式,协助用户完成文案撰写、文档总结、代码生成等各类智力性和创造性工作,引领行业新变革。商业银行可以聚焦远程银行、基层网点等大基数员工群体共性需求,持续加大新技术面向全业务流程的综合化运用,形成端到端的业务智能化解决方案,全方位提升银行服务的工作质效。

在远程银行客服领域,工商银行围绕远程银行中心数千人的客服团队,贯穿坐席事前、事中、事后全流程,聚焦对客服务中枢的运营团队、群体基数较大的人工坐席、工作量较为繁重的质检人员,重新定义该群体的作业和生产模式,基于大模型能力赋能全流程业务场景。

在事前智能客服知识运营阶段,利用大模型自动完成数据标注与知识维护,助力提升传统智能客服分流质效。在事中服务客户阶段,利用大模型打造前情摘要功能、知识随行功能、工单智能填写功能,极大提升坐席运营效率,压降通话时间。在事后质量检查阶段,生成传统质检AI模型数据,即模拟坐席及客户问答,提升传统质检模型准确率。

在行内智慧办公领域,工商银行全面升级办公模式,利用大模型的文本生成、问答能力,围绕邮件、文档、会议、员工日常事务等方面,优化行内办公工具的交互体验,助力全行40万员工的办公效率提升。比如会议纪要生成,根据会议对话内容,大模型快速生成会议纪要初稿,降低人工记录会议纪要的成本,助力全行办公领域智能化。

在智能研发领域,工商银行利用大模型代码生成、代码识别与检测、代码转自然语言等领域的全方位能力,构建基于大模型的智能研发体系。截至目前人工智能编码助手共收集到超2100万个字符编码数据,录入代码超80万行,编码助手生成代码量占总代码量的比值从20%提升至40%,有效提升一线开发人员编码效率和质量。

大模型本质是一个海量参数的深度学习算法,受制于当前模型黑盒、计算复杂度高、推理结果不可预知等因素,存在答非所问、应用成本高、科技伦理风险等方面问题。比如,大模型生成的内容中可能存在明显的宗教偏见、性别歧视等现象,有违社会伦理。有时候内容看起来合乎逻辑,但可能并非真实甚至是捏造的事实,存在非法利用、造谣等安全隐患。数据隐私保护也存在隐患,大模型训练数据来源于互联网、业务数据,这些数据可能涉及大量用户隐私,需要通过隐私计算、联邦学习等方式进行保护。

国家高度重视大模型应用安全,国家网信办于7月13日联合国家发改委、教育部、科技部、工信部、公安部、广电总局发布《生成式人工智能服务管理暂行办法》,从适用范围、管控要求、鼓励导向等方面明确生成式大模型管理要求,旨在促进基于大模型的生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。

虽然大模型有各类安全风险,但同样给银行业数字化转型带来新机遇。在这过程中,我们需要解决数据、算力、算法、应用等诸多挑战。

一是大模型需要大数据。通过数据驱动,释放数据要素价值,加速金融行业和企业大模型建设,加速推进银行业数字化转型。

二是大模型需要大算力。当前国内外算力市场面临着算力供给短缺、多厂商异构算力融合、国产AI生态不足、机房和网络建设等复杂情况,金融机构需要深化与产界各方的合作,来共同推动解决大规模算力部署和应用挑战。

三是大模型需要大合作。银行业要加快探索引入业界通用的大模型技术的策略和实践,通过推进大模型算法在银行业的应用实践,加快大模型能力增强,从而提升大模型服务金融行业能力。

四是大模型需要大创新。大模型要能在银行深化应用,就需要探索形成一套面向银行业的高标准、低门槛的银行业金融大模型应用模式,来快速推进人工智能在金融领域的深化应用。

关于大模型应用落地,目前业界尚无标准方法论,企业可按照场景通用化、专业化程度,分别使用基础大模型、行业大模型、企业大模型、任务大模型。四层模型训练数据规模和投入算力逐层递减,专业属性逐层增强。其中,基础大模型由于投入数据量大、算力成本高、算法难度大,由头部AI公司进行建设,虽然通识能力较强,但其缺少金融专业知识,对金融场景应用有限。

对于大型金融机构而言,因金融数据海量,应用场景丰富,可引入业界领先的基础大模型,自建金融行业、企业大模型,考虑到建设周期较长,可采用微调形成专业领域的任务大模型,快速赋能业务,比如工行前期和鹏城实验室联创,通过微调,率先实现了人工智能大模型在行业内的应用。对于中小金融机构而言,综合考虑应用产出和投入成本的性价比,可按需引入各类大模型的公有云API或私有化部署服务,直接满足赋能诉求。

工商银行经过5年多的建设,目前已经沉淀人工智能模型3000余个,包括传统机器学习模型、传统深度学习模型和大模型三类。一是传统机器学习模型因可解释性强,广泛用于欺诈交易预测、理财产品营销推荐等智能决策分析应用,二是传统深度学习模型广泛用于OCR识别、人脸识别、语音识别等感知识别类任务,有效提升劳动密集型工作;三是大模型,其计算复杂度最高,可解释性最低,具备的能力最强,经过探索实践,大模型可用于文本、图像等AIGC任务,提升智力密集型工作质效。从趋势来看,大模型随通用能力增强,将逐步超越传统模型的能力,但受制于计算复杂度高、可解释性差等问题,短期内,大模型和传统模型会共存,同时,大模型强大的语义理解能力使其可作为中控,将传统模型作为技能进行调用。

通过前期实践,我们认为大模型在文本、图像等领域的AIGC能力优势明显,但当前阶段并不成熟,仍存在科技伦理风险等问题。因此,短期内不建议直接对客使用,应优先面向金融文本和金融图像分析理解创作的智力密集型场景,以助手形式,人机协同提升业务人员工作质效。后续建议在如下四个方面加强建设。

一是场景方面,金融行业需持续加快千亿级大模型场景建设。大模型参数规模越大,可容纳的知识越多,能力越强。千亿大模型具备更强的逻辑推理和生成能力,可更好支撑存在大量逻辑推理、分析复杂的场景,如财务报告智能分析、金融人才智能招聘等。同时千亿级模型资源消耗是百亿级的2-4倍,因此在未来一段时间内是百亿和千亿搭配应用。

二是数据方面需持续完善大模型数据工程建设。大模型的突破得益于高质量数据的发展,数据的高效处理方式是大模型成功的关键要素。随着数据集规模的增大,数据管理难度也在攀升,需持续提升大模型数据清洗的工程化能力,高效去除有害、非事实数据,助力大模型训练数据质量提升,并从单一的结构化数据转向多模态的全领域数据。

三是工程化应用方面,需持续提升大模型工程化流水线能力。随着大模型参数规模的提升,训练过程所需的计算资源也呈现指数级增长,需要强大的计算能力来支持高效的分布式训练和推理。现有计算集群在进行大规模并行训练过程中,由于硬件故障等原因,稳定性仍存在较大问题,需提升训练任务失败时快速定位问题能力,保障训练效率。

四是评测标准方面,需建立金融行业大模型评测标准体系。为保证大模型在各场景能力方面展现出优异效果,需建立一套全面、客观、高效的测评体系,并结合业界各方智慧与行内真实应用,制定一套符合自身的测评标准,保证对大模型的效果及安全状况进行全面测评。

我们相信在大模型的助力下,金融机构将不断提升人机协同智能化、经营决策智能化、业务流程智能化,赋能数字化转型。工商银行将与“产学研用”各方开展深度合作,把握生成式人工智能重大发展机遇,加快推进AI大模型在业务方面的广泛应用,全面提升金融服务质效,助力高质量发展。

(本文仅代表作者观点,不代表论坛立场。)

内容来源:CIC金融科技与数字经济专家委,原标题为《金融行业AI大模型落地探索与实践》。

责任编辑:张柯柯