科大讯飞刘庆峰:改善民生和社会发展的事业 需要根植在自己的算力安全平台上
本报记者 陈佳岚 合肥报道
对于国产大模型厂商而言,他们的目标不仅是想要在算法上追赶ChatGPT,还在努力实现算力充足保障,甚至能对标英伟达芯片性能。
5月6日,科大讯飞发布星火认知大模型,并向外界实时展示了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力、多模态等多项能力。6月9日,讯飞星火认知大模型V1.5推出,开放式知识问答、逻辑推理数学及多轮对话等能力得到升级。
8月15日,《中国经营报》记者从科大讯飞方面获悉,讯飞星火认知大模型再次升级至V2.0版本,代码升级和多模态能力得到提升,并联合华为推出了讯飞星火一体机,开始布局大模型算力,重视算力安全。
“去年10月7日,科大讯飞再次被列入美国实体清单极限施压。再往后,美国又给出了对于中国人工智能相关算力和带宽的限制。在这种情况下,我们要不断拉开通用人工智能的产业大幕,改善民生和社会发展的事业,需要根植在我们自己的算力安全平台上。”科大讯飞董事长刘庆峰表示,科大讯飞正在与华为打造面向超大规模参数大模型训练的国产算力集群,在单卡算力上,该平台对标英伟达A100性能。
大模型两方面能力升级 加速对标ChatGPT
记者了解到,讯飞星火认知大模型V2.0在代码升级和多模态能力两大方面进行了升级。
本次讯飞星火V2.0对代码能力进行5个维度的升级,包括代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
科大讯飞研究院院长刘聪在现场演示,使用Python画红色的心形线、画出马鞍面方程三维立体图并设置渐变色、用代码生成小游戏。
另外,星火大模型还可以使用Python处理视频。在演示过程中,星火V2.0使用Python处理了一段长达2分钟的视频,从中提取第二到第十秒,把画面缩小一半,同时加速5倍,然后保存成gif图片。在现场演示中,星火大模型还完成了“贪吃蛇”游戏的代码生成,并让游戏流畅运行。
刘庆峰表示,代码能力不仅应用于讯飞教育数字基座,还广泛应用于医院、大学、企业、政府等不同的机构,通过iFlyCode实现快速搭建和低成本迅速呈现,“这就是我们说的通用人工智能为什么会深刻改变今天以人力和时长为主要逻辑的商业模式,实现整个产业的彻底的颠覆和升级”。
据刘庆峰介绍,目前,讯飞星火大模型V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%,明年上半年将正式对标GPT4。
而在多模态能力升级方面,具体体现在图像描述、图像问答、识图创作、文图生成、虚拟人合成等多个维度。
“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频。”刘聪现场如此问道,随后,星火模型便生成了一段虚拟人的短视频,短视频中,一个身穿民国风格的女生站在不断切换的秋天美景前娓娓道来。
“多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。”刘庆峰强调,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域,它可以从真实世界获得越来越多的数据,在产品终端有学习、训练和提升,包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。
联合华为推出讯飞星火一体机布局大模型算力
去年12月15日,科大讯飞正式启动讯飞星火认知大模型1+N的专项攻关计划,1对标ChatGPT通用认知大模型,N赋能各个行业赛道的应用。刘庆峰也多次表示,星火认知大模型通用模型将在10月24日直接对标ChatGPT。
“我们不仅在算法上有了充分的信心,在算力上也迈出了重要一步。”刘庆峰说。值得注意的是,除了不断对大模型进行升级,做到对标ChatGPT,科大讯飞还联合华为推出讯飞星火一体机,开始布局大模型算力,对标英伟达芯片性能,保障充足算力。
“认知大模型深度赋能时代已经到来,健康发展急需构建安全可控保障。”刘庆峰表示:“安全可控”“场景驱动”和“专属模型”是认知大模型在行业深度应用的关键三要素。他认为,实现大模型的“安全可控”,要解决“算力安全”和“内容安全”两大难题。
在算力安全上,讯飞星火和华为昇腾联合发布了星火一体机,星火一体机基于昇腾AI硬件、昇思AI开源框架,提供业界领先的大模型训练、推理能力,为大模型全流程创新提供坚实的自主创新算力底座。
“科大讯飞拥有自研大模型训练平台,具备训练和数据闭环全流程设计、大模型训练和推理一体化设计、大规模异构算力兼容、支持混合云架构易拓展等优势,华为基于昇腾AI基础软硬件的高算力AI芯片、高性能算子库、多卡高速互联、分布式存储等优势,我们正在跟华为一道打造面向超大规模大模型的训练国产算力的集群,形成集群化的优势。”刘庆峰表示。
据悉,星火一体机可提供对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,以及办公、代码、客服、运维、营销、采购等10种以上即开即用的丰富场景包,支持3种模型尺寸供用户选择。
刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一所学校、每个医院都有机会构建自己的专属大模型。目前,讯飞星火已完成的在金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。
值得注意的是,8月15日,由国家网信办联合国家发改委、教育部、科技部、工信部、公安部、广电总局公布的《生成式人工智能服务管理暂行办法》(以下简称《办法》)正式施行。《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展。从政策层面来看,为人工智能发展系上“安全带”是大方向。
“4月28日中央政治局的会议,以及8月15日正式开始生效的七部门关于生成式人工智能的文件,都要求我们既要兼顾发展,又要兼顾安全。”刘庆峰对记者表示,《办法》给了生成式人工智能行业非常明确的标准,比如七部门关注安全的主要范围和内容,标定了企业自主发力的方向,哪些东西需要得到网信办的双新认证,给大家形成了边界。
驱动C端市场增长 B端成长空间待打开
经过两个月,讯飞星火已陆续在教育、办公、汽车、金融、工业、医疗等行业推进真实可见的应用落地。
在星火大模型的赋能加持下,科大讯飞学习机、办公等消费类硬件产品在短时间内实现了较快销量增长。
科大讯飞中报显示,2023年5月至6月,科大讯飞C端硬件GMV创历史新高,同比翻倍增长。其中,搭载讯飞星火认知大模型的讯飞AI学习机GMV在5月和6月分别增长136%和217%。讯飞 AI 硬件(AI 学习、AI 办公、AI健康)在“6·18”期间销售额同比增长125%。与此同时,公司上半年智慧教育C端占比已提升至 40%。
对于C端市场的表现,刘庆峰对记者表示,C端市场相比于B端市场能更简单触达用户,比如星火语伴,用户一拿到就能用、解决问题,而且能看到立竿见影的效果。
“而B端市场要应用,涉及更复杂的内部知识库如何导入进来学习和训练,投资成本也比较高,决策链条相对更长,以及B端场景感暂时没有C端那么直接,不过,B端场景化已经看得越来越清楚了。”刘庆峰介绍,对于B端市场,一旦大家理解了它,有了一套科学的测试方法,找准应用场景能够评估出来,投入产出成效,市场迅速就会起来,当前科大讯飞正在构建一些B端的典型案例,让用户看到它的价值。
刘庆峰对记者预计,数字基座、医疗诊后管理这些领域将在未来的三个月到半年会出现明确的增长,尤其等商业应用完全放开之后,“是骡子是马,拿出来试一试就知道了”。
(编辑:吴清 校对:翟军)