工商银行吕仲涛：如何推动AI大模型在金融行业落地应用？

http://ddx.gubit.cn 2023-09-12 18:01 工商银行(601398)公司分析

近日，中国工商银行首席技术官吕仲涛在“2023中国智能金融论坛”上发表题为《金融行业AI大模型落地探索与实践》的主题演讲。

吕仲涛表示，人工智能大模型技术具有广泛的应用前景，通过大模型可以推动数据与实体的融合，改变行业发展格局，但目前国内大模型在应用层面仍处于起步阶段。他指出，商业银行可以持续加大新技术面向全业务流程的综合化运用，全方位提升银行服务的工作质效。同时，他认为，大模型技术受制于各类因素，存在各类安全风险，落地需要大数据、大算力、大合作、大创新。针对大模型技术落地问题，他建议在四个方面加强建设，一是场景方面，金融行业需持续加快千亿级大模型场景建设；二是数据方面，需持续完善大模型数据工程建设；三是工程化应用方面，需持续提升大模型工程化流水线能力；四是评测标准方面，需建立金融行业大模型评测标准体系。

随着ChatGPT的发布，人工智能大模型技术成为社会各界关注的热点。ChatGPT的诞生，成为了AI界的"iPhone时刻"，其出色的对话能力让其成为历史上用户增长速度最快的应用。ChatGPT在语言理解、知识储备和回答问题等方面，都展现出了很强的能力和潜力。同时让业界看到大模型广泛的应用前景，通过大模型可以助力行业提质增效，推动数据与实体的融合，改变行业发展格局。结合论坛主题，我主要和大家分享一下AI大模型在金融行业的落地探索与实践。

国际人工智能权威杂志《自然-机器智能》将大模型定义为网络参数规模达到亿级以上的“预训练深度学习算法”。大模型通过海量数据的训练学习，具备了强大的语言理解和表达、思维链推理等能力，在文本图像理解、内容生成等AI任务表现出显著优势和巨大潜力。相较于传统人工智能算法一事一议的建模方式，大模型具备更强的通用能力，可处理多种任务，可较好解决传统模型的碎片化问题。其特点可以总结为“三大一快”。三大，指的是大模型基于“大算力+大数据+大算法参数网络结构”进行训练，实现通用海量知识预置。一快，指的是大模型通用能力强，各行业可在大模型基础上，直接使用或“站在巨人肩膀上”通过再次训练快速学会新知识，快速赋能业务应用。

人工智能在1956年达特茅斯会议上被首次提出后，历经三次发展浪潮，其中人工智能第一、二次浪潮是“小数据、单任务”范式的分析式AI，分别是“专家系统+机器学习”浪潮以及深度学习浪潮，这两个阶段，人工智能技术均不能创造新内容。大模型催生了人工智能第三次浪潮，开始向“大数据、多任务”范式的生成式AI迈进，具备更强的通用性、理解和生成能力，让通用人工智能发展迎来起点，加速通用人工智能走进现实，改变人类的生产生活。

从ChatGPT诞生以来，国内外大模型发展浪潮持续高涨，形成了算法研发、产品应用的产业链生态。但相较国际领先水平，国内大模型仍存在代际差距。从算法生态来说，目前最优秀的大模型是OpenAI的GPT-4，这是一个多模态大模型，在很多领域专业和学术基准上表现出人类水平。国内各类AI公司也纷纷入局，已推出如百度文心一言、阿里通义千问、讯飞星火等产品，各有千秋。从应用层面来说，微软依托投资GPT4红利，已在搜索、办公、安全等传统领域推出智能化产品。国内在应用层面仍处于起步阶段，有待进一步探索。

大模型作为一种新型的人工智能技术，与传统模型相比，具备强大的通用能力和智能创作能力，可以通过聊天交互模式，协助用户完成文案撰写、文档总结、代码生成等各类智力性和创造性工作，引领行业新变革。商业银行可以聚焦远程银行、基层网点等大基数员工群体共性需求，持续加大新技术面向全业务流程的综合化运用，形成端到端的业务智能化解决方案，全方位提升银行服务的工作质效。

在远程银行客服领域，工商银行围绕远程银行中心数千人的客服团队，贯穿坐席事前、事中、事后全流程，聚焦对客服务中枢的运营团队、群体基数较大的人工坐席、工作量较为繁重的质检人员，重新定义该群体的作业和生产模式，基于大模型能力赋能全流程业务场景。

在事前智能客服知识运营阶段，利用大模型自动完成数据标注与知识维护，助力提升传统智能客服分流质效。在事中服务客户阶段，利用大模型打造前情摘要功能、知识随行功能、工单智能填写功能，极大提升坐席运营效率，压降通话时间。在事后质量检查阶段，生成传统质检AI模型数据，即模拟坐席及客户问答，提升传统质检模型准确率。

在行内智慧办公领域，工商银行全面升级办公模式，利用大模型的文本生成、问答能力，围绕邮件、文档、会议、员工日常事务等方面，优化行内办公工具的交互体验，助力全行40万员工的办公效率提升。比如会议纪要生成，根据会议对话内容，大模型快速生成会议纪要初稿，降低人工记录会议纪要的成本，助力全行办公领域智能化。

在智能研发领域，工商银行利用大模型代码生成、代码识别与检测、代码转自然语言等领域的全方位能力，构建基于大模型的智能研发体系。截至目前人工智能编码助手共收集到超2100万个字符编码数据，录入代码超80万行，编码助手生成代码量占总代码量的比值从20%提升至40%，有效提升一线开发人员编码效率和质量。

大模型本质是一个海量参数的深度学习算法，受制于当前模型黑盒、计算复杂度高、推理结果不可预知等因素，存在答非所问、应用成本高、科技伦理风险等方面问题。比如，大模型生成的内容中可能存在明显的宗教偏见、性别歧视等现象，有违社会伦理。有时候内容看起来合乎逻辑，但可能并非真实甚至是捏造的事实，存在非法利用、造谣等安全隐患。数据隐私保护也存在隐患，大模型训练数据来源于互联网、业务数据，这些数据可能涉及大量用户隐私，需要通过隐私计算、联邦学习等方式进行保护。

国家高度重视大模型应用安全，国家网信办于7月13日联合国家发改委、教育部、科技部、工信部、公安部、广电总局发布《生成式人工智能服务管理暂行办法》，从适用范围、管控要求、鼓励导向等方面明确生成式大模型管理要求，旨在促进基于大模型的生成式人工智能健康发展和规范应用，维护国家安全和社会公共利益，保护公民、法人和其他组织的合法权益。

虽然大模型有各类安全风险，但同样给银行业数字化转型带来新机遇。在这过程中，我们需要解决数据、算力、算法、应用等诸多挑战。

一是大模型需要大数据。通过数据驱动，释放数据要素价值，加速金融行业和企业大模型建设，加速推进银行业数字化转型。

二是大模型需要大算力。当前国内外算力市场面临着算力供给短缺、多厂商异构算力融合、国产AI生态不足、机房和网络建设等复杂情况，金融机构需要深化与产界各方的合作，来共同推动解决大规模算力部署和应用挑战。

三是大模型需要大合作。银行业要加快探索引入业界通用的大模型技术的策略和实践，通过推进大模型算法在银行业的应用实践，加快大模型能力增强，从而提升大模型服务金融行业能力。

四是大模型需要大创新。大模型要能在银行深化应用，就需要探索形成一套面向银行业的高标准、低门槛的银行业金融大模型应用模式，来快速推进人工智能在金融领域的深化应用。

关于大模型应用落地，目前业界尚无标准方法论，企业可按照场景通用化、专业化程度，分别使用基础大模型、行业大模型、企业大模型、任务大模型。四层模型训练数据规模和投入算力逐层递减，专业属性逐层增强。其中，基础大模型由于投入数据量大、算力成本高、算法难度大，由头部AI公司进行建设，虽然通识能力较强，但其缺少金融专业知识，对金融场景应用有限。

对于大型金融机构而言，因金融数据海量，应用场景丰富，可引入业界领先的基础大模型，自建金融行业、企业大模型，考虑到建设周期较长，可采用微调形成专业领域的任务大模型，快速赋能业务，比如工行前期和鹏城实验室联创，通过微调，率先实现了人工智能大模型在行业内的应用。对于中小金融机构而言，综合考虑应用产出和投入成本的性价比，可按需引入各类大模型的公有云API或私有化部署服务，直接满足赋能诉求。

工商银行经过5年多的建设，目前已经沉淀人工智能模型3000余个，包括传统机器学习模型、传统深度学习模型和大模型三类。一是传统机器学习模型因可解释性强，广泛用于欺诈交易预测、理财产品营销推荐等智能决策分析应用，二是传统深度学习模型广泛用于OCR识别、人脸识别、语音识别等感知识别类任务，有效提升劳动密集型工作；三是大模型，其计算复杂度最高，可解释性最低，具备的能力最强，经过探索实践，大模型可用于文本、图像等AIGC任务，提升智力密集型工作质效。从趋势来看，大模型随通用能力增强，将逐步超越传统模型的能力，但受制于计算复杂度高、可解释性差等问题，短期内，大模型和传统模型会共存，同时，大模型强大的语义理解能力使其可作为中控，将传统模型作为技能进行调用。

通过前期实践，我们认为大模型在文本、图像等领域的AIGC能力优势明显，但当前阶段并不成熟，仍存在科技伦理风险等问题。因此，短期内不建议直接对客使用，应优先面向金融文本和金融图像分析理解创作的智力密集型场景，以助手形式，人机协同提升业务人员工作质效。后续建议在如下四个方面加强建设。

一是场景方面，金融行业需持续加快千亿级大模型场景建设。大模型参数规模越大，可容纳的知识越多，能力越强。千亿大模型具备更强的逻辑推理和生成能力，可更好支撑存在大量逻辑推理、分析复杂的场景，如财务报告智能分析、金融人才智能招聘等。同时千亿级模型资源消耗是百亿级的2-4倍，因此在未来一段时间内是百亿和千亿搭配应用。

二是数据方面，需持续完善大模型数据工程建设。大模型的突破得益于高质量数据的发展，数据的高效处理方式是大模型成功的关键要素。随着数据集规模的增大，数据管理难度也在攀升，需持续提升大模型数据清洗的工程化能力，高效去除有害、非事实数据，助力大模型训练数据质量提升，并从单一的结构化数据转向多模态的全领域数据。

三是工程化应用方面，需持续提升大模型工程化流水线能力。随着大模型参数规模的提升，训练过程所需的计算资源也呈现指数级增长，需要强大的计算能力来支持高效的分布式训练和推理。现有计算集群在进行大规模并行训练过程中，由于硬件故障等原因，稳定性仍存在较大问题，需提升训练任务失败时快速定位问题能力，保障训练效率。

四是评测标准方面，需建立金融行业大模型评测标准体系。为保证大模型在各场景能力方面展现出优异效果，需建立一套全面、客观、高效的测评体系，并结合业界各方智慧与行内真实应用，制定一套符合自身的测评标准，保证对大模型的效果及安全状况进行全面测评。

我们相信在大模型的助力下，金融机构将不断提升人机协同智能化、经营决策智能化、业务流程智能化，赋能数字化转型。工商银行将与“产学研用”各方开展深度合作，把握生成式人工智能重大发展机遇，加快推进AI大模型在业务方面的广泛应用，全面提升金融服务质效，助力高质量发展。

（本文仅代表作者观点，不代表论坛立场。）

内容来源：CIC金融科技与数字经济专家委，原标题为《金融行业AI大模型落地探索与实践》。

责任编辑：张柯柯