科大讯飞回应“套壳”,AI大模型狂潮祛魅

http://ddx.gubit.cn  2023-06-05 15:59  科大讯飞(002230)公司分析

“星火大模型与OpenAI,是什么关系?”

“我和OpenAI没有关系,我是讯飞星火认知大模型,我是由科大讯飞优秀的人工智能科学家、工程师和语言学家等组成的团队自主研发的。”

当「商业秀」在星火认知大模型输入以上问题后,它很快给出了答复。这与近期讯飞星火大模型的一则传言不符。

近日有网友发现,讯飞星火大模型在有些“问答”中会出现“我是由OpenAI开发的”等内容,由此一则关于“讯飞星火大模型被质疑‘套壳OpenAI的ChatGPT’”的消息传播开来。

5月11日,科大讯飞在最新披露的投资者关系活动记录表中表示,星火大模型“套壳OpenAI的ChatGPT”既不符合事实,也不符合逻辑。

科大讯飞具体表示,如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比ChatGPT还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。

我们有理由相信,此时的科大讯飞,比任何一家公司都需要大模型的故事,而非“套壳”事故。且先不论大模型本身的优劣,光看科大讯飞迅速辟谣这一行径,足见星火大模型对其之重要。至少在挽救股价层面,大模型的影响无出其右,就在这个季度乃至更漫长的一段时间内,均是如此。

今年4月底,科大讯飞发布了2022年财报和2023年一季度报,财报显示,净利润出现大幅下滑态势,市场似乎对其瞬间丧失了大部分信心,股价一路下跌。直到5月6月(星期六),科大讯飞发布星火大模型,在5月8日开盘后,其股价才开始拉升10%,此后数日,一度呈现上涨趋势。市场对这家公司,似乎又恢复了信心。

推出大模型,再经历被质疑“套壳OpenAI”事件,科大讯飞也必须面对共同的AI话题:大模型纷纷扎堆,是时候该理性祛魅了。

在这个大模型横空出世的时代,科大讯飞并非“孤勇者”。自ChatGPT发布以来,掀起的科技军备竞赛就一直没有停息,其余威在国内也愈演愈烈,各家公司在AI领域“卷”个不停,前段时间大模型集中爆发,被评价为“颇有十年前互联网‘百团大战’甚至‘千团大战’的气势”。

据不完全统计,在ChatGPT发布后的短短4个月时间里,至少已经有30多个国内研发机构和企业,在ChatGPT发布之后纷纷推出了自己品牌的大模型和相关产品。

一时间,整个科技圈“类ChatGPT”比比皆是,声称“国内首发”的企业更是不少,资本市场风起云涌。与大模型相关的媒体报道铺天盖地,随后又陷入一阵短暂的沉寂。而下一波,大概率还在来的路上。

大模型带来的机遇不言而喻,但在这场疯狂的竞赛中,谁又能真正走到最后?决战未来,各家真正的核心竞争力又是什么?

从商业发展的历史规律来看,喧嚣过后,市场终会挤破泡沫,大模型狂潮不可能永远持续。只有冷静思考大模型能够带来的内核性改变,才能真正抓住这场由AI技术带来的产业变革机会。

“目前星火认知大模型在国内明显遥遥领先,中文已经超越ChatGPT,英文已接近。”在科大讯飞星火认知大模型发布会上,刘庆峰自信满满地说道。

作为继百度、阿里、商汤、昆仑万维后,第五家正式发布大模型的公司,科大讯飞一上场,就迫不及待展示自己的强大能力。

刘庆峰更是全程主持发布会,并与科大讯飞研究院院长刘聪现场展示了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力等多项能力。

在现场演示环节,刘聪提问:“你为什么叫星火 ”“如果有个小伙子跟女朋友吵架了,那他应该宁死不屈还是能屈能伸?” “孔子在2008年北京奥运会上说了什么?”等各类稀奇古怪的问题,星火迅速“接招”,并给出了恰如其分的回答。

在数学能力方面,刘聪也抛出了“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”这类计算问题。星火也很快给出了答案,并罗列了相关解题步骤。

刘庆峰随即表示,数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先,也超过了ChatGPT。

对此,「商业秀」也进行了多轮“挖坑式”测试,例如询问“姚明在几几年获得了亚洲足球先生的称号?” “范志毅在NBA服役多少年?斩获了多少个进球?”等问题。星火都准确识别出了人为“陷阱”,并给出了恰当的回答。

这表明,在常识性问题上,星火都进行了一定的训练,并具备一定的纠错能力。

相同的问题,「商业秀」也通过ChatGPT-3进行了测试,其同样也给出了恰当的回答,但在信息丰富度上不及星火全面。

在数理能力上,「商业秀」也测试了“鸡兔同笼,鸡兔一共有25只,笼子里脚一共有74只,请问分别有多少只鸡和多少只兔子?”“一支股票今天涨10%,明天跌10%,请问赚还是赔?”等问题,星火也迅速给出了正确回答。

「商业秀」将同样的数理问题抛给了ChatGPT-3,在这方面,结果显示ChatGPT-3的回答更有逻辑性。后者先给出了结论,再给出了具体实例,并且还会有延伸的问题,配合原问题答疑解惑。

星火还支持语音提问和输出,即可通过语音提问,模型输出的答案也能转换为语音,并能通过持续对话调整语音风格。

「商业秀」通过语音询问“鸡兔同笼,笼里一共有35只,一共有94只脚,问一共有多少只鸡和多少只兔子” “中国拿到网球大满贯职业选手是谁”等问题。星火也准确识别了语音内容,并给出了相应的答案。

但这个操作,要求提问者的语速要很慢,并且能一字一句以标准普通话说出,否则星火可能无法准确识别出相应文字,或文字识别不准确导致回答有误。

经过多轮测试,「商业秀」认为,星火具备了一定的大语言模型能力,并且能够在某些特定领域输出自己的商业价值。

在发布会上,科大讯飞还发布了一系列结合星火大模型的产品,例如讯飞智能办公本能将语音实时转写与墨水屏纸感书写相结合,对会议记录内容形成一份精简的会议纪要;“星火大模型+智能座舱”为数千个车型提供多轮、多人、多区域、多模态的语音交互;基于大模型的生成式RPA(机器人流程自动化),让数字员工更智能……

但星火也不是没有缺点,刘庆峰自己也在发布会上坦言,“大模型技术目前还存在不少待攻克的缺陷。包括新知识难以及时更新、事实类问答容易‘张冠李戴’,史实、传统典籍等容易‘编造情节’等问题。”他随之提及,上述问题在今年会有明显的改进。

据了解,星火认知大模型始于2022年12月。彼时,科大讯飞启动了“1+N”大模型技术攻关。其中,“1”是通用认知智能大模型算法研发及高效训练方案底座平台,“N”是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。

不到半年时间,星火认知大模型正式面世,研发时间之短暂、模型发布之匆忙,这直接导致包括科大讯飞在内的很多企业被外界质疑。

确实,在这么短的时间内,星火的面世仅仅是一个开始,它仍需经过多轮迭代优化。刘庆峰在发布会上公布了星火认知大模型的发展规划:今年6月9日,星火大模型将突破开放式问答,多轮对话能力和数学能力再升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。

从这份规划日期来看,科大讯飞甚至细化到了哪一天,这从侧面或许表明其急于想将大模型能力落地应用,从而推进商业化。业内认为,这或许与近几年科大讯飞的商业化能力不佳有关。

此前,科大讯飞优异的业绩与赚钱能力常被业内称赞,但在经历了连续10年的增长后,神话基本结束于2022年。

科大讯飞2022年财报显示,该公司实现营收188.2亿元,同比微增2.77%;毛利为76.84亿元,同比微增2%;归母净利润5.61亿元,同比下滑63.94%;扣非净利润4.18亿元,同比下滑57.31%。

这还是科大讯飞录入政府补贴后的数据,2022年,科大讯飞政府补贴金额为11亿元。与此同时,这也是近五年来科大讯飞净利润同比增长率首次出现下滑。数据显示,从2018年到2022年,科大讯飞的净利润增长率分别为24.71%、51.12%、66.48%、14.13%和﹣63.94%。

资本市场对这一成绩单颇感失望,在财报发布后,科大讯飞股价下跌超9%。

对于业绩出现如此大幅变动,科大讯飞方面给出了三个原因。

首先是大环境的影响,科大讯飞表示“受到去年12月份和今年1月份特殊的社会经济客观环境,以及春节假期影响,导致部分项目无法顺利及时推进”。

其次,继2019年被列入美国实体清单,2022年10月7日被再次极限施压,由于调整供应链和相关合同签署等工作影响了当季订单节奏。

最后一点,与星火大模型有关。科大讯飞提到,去年12月启动的“1+N认知智能大模型专项攻关”影响了当期利润,这从侧面印证科大讯飞在大模型上的投入很大。

来到今年,这三大原因仍持续影响科大讯飞的业绩。

数据显示,2023年一季度,科大讯飞实现营收28.88亿元,同比下降17.64%;净亏损5789.5万元,上年同期净利润1.1亿元;扣非后归母净亏损3.38亿元,上年同期净利润1.46亿元。

据界面新闻报道,科大讯飞总裁吴晓如透露,2022年和2023年一季度讯飞净利润下滑严重主要在于公司在教育、医疗等持续运营型业务的合作平台拓展投入、新产品研发以及核心技术自主可控和国产化适配等方向新增投入约8亿元。

不过,科大讯飞对业绩下滑的情况似乎不太担心。在业绩会上表示目前基于在国产替代和业务开拓上的进展,预计从今年二季度开始将实现收入和毛利正向增长,并有信心实现全年高质量增长的目标。

科大讯飞的主营业务分别包括教育产品与服务、信息工程和开放平台。其中教育产品是其主要营收来源,占到总营收比例的32.74%。

科大讯飞还构建了面向G端、B端和C端三类客户的业务体系:G端主要是面向地市县等区域,涵盖区域内各类学校和用户的因材施教解决方案;B端主要是面向学校的大数据精准教学、英语听说课堂、智慧作业等;C端主要以面向家长的AI学习机、个性化学习手册、课后服务课程服务等产品。

财报显示,G端业务目前已累计在 50 多个市、区(县)级应用;B端业务中的讯飞课后服务业务已覆盖超300区县、12000余所学校;C端的AI学习机该年销售额增长超50%,但并未透露出具体销售数量与金额。

而实际上,其业绩与目标业绩尚相差甚远。科大讯飞曾在2022年初的公告中提到,各项根据地业务预计保持50%的增长。同时提到,2022年个性化学习手册业务预计营收增长超70%,AI学习机收入目标增长200%+,目标十四五做到年收入100 亿元。

除了主营业务未达预期外,科大讯飞的智慧城市、开放平台及消费者业务、智慧汽车、智慧医疗等业务表现也较为一般。

财报显示,智慧城市下属的信息工程、数字政府行业应用、智慧政法行业应用三大板块与开放平台业务均呈现同比下降态势。智慧汽车、智慧医疗与智慧金融业务虽然呈同比增长态势,例如智慧金融同比增长19.33%,但在整体营收规模中的占比实在少得可怜,智慧金融仅占比1.25%,智慧汽车与智慧医疗分别占比2.47%和2.48%。

如此看来,科大讯飞的主营业务表现不佳,创新业务又还远未达到大规模营收的阶段。此时的科大讯飞,必须要抓住大模型带来的巨大价值,为各项业务增加更多商业竞争力。

但如今处于风口浪尖的大模型,能否帮助科大讯飞实现目标,还需要时间去验证。

今年数月以来,全球的科技企业们处于一种近乎疯狂当中。放眼国内外,围绕大模型发布的浪潮迭起,尤其是国内的科技巨头们接连推出了自己的大模型产品。

据「商业秀」不完全统计,目前已推出大模型产品的公司有百度文心一言、阿里通义千问、华为盘古、商汤日日新、昆仑万维天工以及科大讯飞星火,同时王慧文、王小川等互联网大佬创立的大模型公司也迅速获得了融资。

但这么多大模型都能顺利跑出来吗?大模型的核心竞争价值到底是什么?大模型还能带来哪些颠覆性机会?

疯狂的大模型浪潮,也该到了理性审视的祛魅阶段。

“现在涌现出很多大模型产品,但围绕大模型的训练和调试成本投入非常高,一般公司真烧不起,同时对中小企业来说自研经济性较低,未来竞争更大可能发生在巨头之间。”某风投机构投资经理董浩对「商业秀」表示。

英伟达的研究表示,GPT3最大规模的模型需要使用到175 Billions的参数量,需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练长达一个月的时间。每月大模型训练成本在数百万美元以上量级。

上月,由中国人工智能学会主办的人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇发表的演讲中也提到,大模型开发和训练的单次费用高达1200万美元。

大模型开发成本如此高昂,但应用成本(收费)很低。OpenAI在今年3月开放API(应用程序接口),允许第三方开发者通过API将ChatGPT集成至应用程序和服务中。其将接口服务定价为0.002美元/每1000 tokens,这一定价较GPT 3.5模型便宜约90%。

从经济角度考虑,这一定价很难将巨额研发投入赚回来,更不用说盈利了。所以这终究不是中小企业耗得起的生意,只有巨头才有资金、资源投入,抢占未来的一席之地。

或许正因如此,目前已发布大模型产品的企业,都将大模型能力内置到了自身已有的成熟产品中。“这一做法既能提高现有产品的AI能力,又可吸引更多客户为具体产品买单,而不是仅收取接口服务费。”一位业内人士告诉「商业秀」。

但即便如此,国内大模型的竞争也极为激烈。作为大模型应用较为成熟的办公领域,就有多家企业推出了相关产品,如百度“文心一言”具备制作PPT的能力;钉钉接入阿里“通义千问”后可唤起10多项AI能力;字节跳动旗下办公应用飞书也将上线AI助手“MY AI”;金山办公也推出“WPS AI”应用等。

这一次,科大讯飞在星火大模型发布会上也发布了录音笔、翻译笔、办公本等办公产品,意在抢占更多办公场景的用户。但是否真的能掘金成功,还要看接下来用户的实际反馈情况。

“虽然大模型竞争主要在巨头之间,但巨头也难以做到一家独大,这其中的关键就在于数据。不同玩家积累的数据不一,就可能在特定领域建立自己的核心优势与独有场景。”董浩进一步表示。

举例来说,阿里有天猫、淘宝的电商数据,菜鸟系的物流数据,这是其他企业无法获取的独有数据,同样科大讯飞在教育领域深耕多年,也积累了自己的独有数据。这些数据,或许就是真正拉开企业差距的关键。

也就是说,那些没有持续资金支持的中小公司,或许很难做出真正的通用大模型产品,而各个大厂推出的通用大模型产品,已经在急于考虑商业变现,缺乏研发耐心与技术突破。

董浩直言,“这一切都来得太快了,还没几个月,各家大模型似乎都成熟可商用了,但事实上这其中必然存在诸多泡沫。”

眼下这场狂热的大模型竞赛才刚刚开始,在巨头和企业疯狂入局与厮杀的同时,不少业内人士也疾呼:是时候该回归初心,对技术保持敬畏,对商业保持探索,而不是一味追求速度、规模与效率,才能迎来大模型最好的时代。

(文中对话者均为化名)