科大讯飞发布星火认知大模型 刘庆峰称今年10月可对标GPT3.5

http://ddx.gubit.cn  2023-05-07 15:30  科大讯飞(002230)公司分析

经济观察网 记者 周应梅5月6日,科大讯飞正式发布了讯飞星火认知大模型。在现场演示中,基于星火认知大模型的机器人对话产品拥有知识问答的能力,并能完成各类文本写作以及方案策划,同时还可以进行数学计算。

科大讯飞董事长刘庆峰表示,今年内星火认知大模型将带来三次更新升级,6月9日突破开放式问答,多轮对话能力和数学能力再升级;接下来是到8月15日,突破代码能力,多模态交互再升级;到今年10月24日,通用模型对标ChatGPT(GPT3.5),中文能力实现超越ChatGPT,英文能力与ChatGPT相当。

在中国打造OpenAI成为很多企业竟逐的目标,大模型赛道火热,产品一个接一个。酝酿半年,科大讯飞的星火认知大模型成色如何?与其他公司有何不一样?

初步应用到四个领域

准确性方面,向基于星火认知大模型的机器人对话产品提问“孔子在2008年奥运会上说了什么?”星火认知大模型可发现问题中错误事实,并在回答中纠错。不过记者试用星火认知大模型的聊天机器人时问了两个类似的问题,聊天机器人有一次可以发现问题中的错误之处,有一次则无法识别到错误直接回答。

刘庆峰提到,纯大模型技术依然有难题待攻克,大模型机器人对话产品还会出现事实上的“张冠李戴”、编造历史情节等问题,这也是所有做大模型产品的公司面临的问题。

科大讯飞不单发布了大模型产品,也展现了旗下产品搭载大模型后的变化。从一开始就考虑大模型能力落地应用,是科大讯飞与其他公司的不同之处。目前星火认知大模型的技术能力已应用于教育、办公、汽车、数字员工四个领域。比如讯飞学习机系统搭载星火认知大模型能力后,可以批改作业,识别用语错误以及给出评语等。而讯飞听见搭载星火认知大模型的能力后,在网页版上线了“会写”功能,上传音频可以选择输出新闻稿、策划方案,添加关键词则可以写出不同主题的内容。汽车领域则通过改善车载人机交互,达到更拟人化地沟通。

在现有产品中融入大模型能力是比较明确的商业化方向。4月11日,阿里云宣布未来阿里巴巴所有产品将接入通义千问大模型,进行全面改造。例如钉钉接入通义千问大模型后,新增自动生成工作方案等功能。微软则将ChatGPT同源技术嵌入办公软件,例如接入新技术后在Word中,可以根据口令编写和生成文本。

刘庆峰表示,从行业角度来看,目前科大讯飞已经搭载大模型的应用都可以变现,未来会有更多行业落地方案,围绕科大讯飞的400万开发者生态,在各个领域做产品的升级。

在人员投入方面,刘庆峰告诉经济观察网记者,星火认知大模型核心团队人员200多人,外围业务相关的人员涉及1000多人。他表示,要把大模型做好,不是靠堆人,OPen AI做GPT核心团队人员也不多,关键是方向要明确。星火认知大模型分了8个子项目,每个领军人物需要在AI领域有8到10年的经验,团队大部分成员是85后和90后,保障创新能力。

算力问题受关注

算力方面,科大讯飞与华为、寒武纪、曙光等公司有合作,讯飞研究院院长刘聪称,按照讯飞今年的推进流程,星火认知大模型计划今年10月份追赶上GPT3.5的水平,当前的算力够用。

刘庆峰认为,中国企业在算力方面与国际企业有差距是一个事实,科大讯飞正与国内合作方研究,如何在算力落后一代的情况下把大模型算法做好。

为更科学地测评大模型能力,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。

接下来,星火认知大模型的下一个领域应用是医疗行业,医疗的专业大模型预计在今年10月的“1024开发者节”期间正式发出。刘庆峰表示,医疗要更加严肃、更加谨慎,还需要满足很多医疗相关的法规。

多模态输入和利用大模型提升代码能力将成为星火认知大模型升级的方向。星火认知大模型目前还是纯文本模型,包含图片的多模态的输入和表达计划在星火大模型下一代推出,刘庆峰表示最迟在8月份可以提供给科大讯飞的客户使用。此前GPT4也增加了图片输入测试,不过这个功能还未对外开放。

“代码能力我们刚起步,只是有了初步的数据,现在代码运行以后,在国内已有系统中我们还是相对有优势的,但是跟ChatGPT相比还有很大差距,在未来2、3个月会有非常大的提升。”刘庆峰表示,星火认知大模型的代码能力重点针对工业互联网。

目前科大讯飞的星火认知大模型主要对行业合作方和开发者开放,而个人用户也可通过星火认知大模型官网申请试用。