天风证券孔蓉:多模态能力是后续大模型发展技术重点
转自:上海证券报
上证报中国证券网讯(记者 罗茂林)近日,以“智联世界 生成未来”为主题的第六届世界人工智能大会(简称WAIC)在上海圆满落幕。今年大会上,“大模型”成为大众关注的焦点。日前,刚从美国硅谷考察回国的天风证券全球前瞻产业研究院联席院长孔蓉接受上海证券报记者专访,她表示,得益于过去互联网产业的高速发展,中国在大模型领域有深厚的人才与技术积累。她认为,随着大模型底层架构的逐渐成熟,未来多模态发展方向值得期待。
上海证券报:您刚从美国硅谷调研人工智能产业回来,能否跟我们介绍一下这趟美国之行的一些收获。
孔蓉:目前,海外大模型有两类,一个是头部科技公司在做,另一个则是该领域资深专家、大厂创始人组成的创业团队在做。后者一般都有着非常豪华的背景,团队实力也比较强。
我们看到大模型本身对于算力等各方面都有很高的要求,因此,无论是资本投入、技术投入要求还是比较高的,所以它是一个进入门槛相对来说比较高的领域。
并且这次在美国硅谷考察期间,我也注意到目前硅谷公司在To B业务端的AI应用创新很多,包括各种生产力工具的创新,这也是一个很值得关注的趋势。
而在国内,目前我们能看到今年大会上的“百模大战”,各大厂商都在争相推出各自的大模型,并且目前许多头部厂商也把目光投向了To B产业端。我认为,下一步,相对于大模型本身的创新,AI发展可能要聚焦在应用层面,寻找落地场景。
上海证券报:目前国内外大模型领域的技术水平大致是怎样的状态?
孔蓉:我们看到,目前国内外都在围绕大模型技术做一些突破,我们预计,国内厂商开发的大模型在今年内,陆续也将达到接近GPT3.5的一个技术水平。
但是往后看,大家的一个重点可能就在于多模态能力的竞争上。也就是说,除了理解文字外,人工智能能否理解更多样的内容,比如说图片、视频等。虽然我们现在能看到一些“文生图”的应用,但距离理解图片这一阶段,目前的AI在整体智能水平上还有待进一步提升。
我们可以看到,目前国内厂商其实也注意到了多模态应用这块。但是目前来看,可能还需要进一步去做迭代。
另外,从中长期来看的话,我们所说的AGI(通用人工智能)这个发展方向,它需要AI的能力进一步提升。就是要跟人类一样,除了理解文字,它还需要理解周围环境,还要根据接受的外部环境信息去作出反馈。我们看到,这可能是目前美国一些头部科技公司在追求的,就是不仅仅只限于打造一个GPT3.5或者说GPT4.0这么简单。
上海证券报:今年大会上我们看到,国内很多厂商也陆续推出了大模型,好像有三十多款。目前国内外在技术上的差距如何?
孔蓉:可能跟很多人想得不太一样,其实中国在人工智能领域技术上的发展一直是比较前瞻的。
大模型回归到本质上,其实是个工程学问题。得益于过去几十年我国完善的教育体制,中国有非常多的技术工程师储备。从全世界范围来看,我们会发现很多顶尖的大模型团队里都不乏华人工程师的身影。从这点上讲,我觉得中国在AI这一领域,未来有非常强的人才优势和背景。
从目前来看,和海外的差别,我觉得,可能是国外率先在业务上把大模型这条路跑通了。当然这也给我们一个思考,就是如何充分运用好我们的人才优势,吸引、留住我们的人才。
上海证券报:可以理解为技术积累的差距并没有外界想象的那么大,只是技术路线上有分野,对吗?
孔蓉:我觉得这不只是中国,包括美国的一些科技公司,在AI发展路径上的选取也不一样。相当于说有不同的流派,只是说OpenAI选择的这条路,率先跑通。
但其实我们看GPT,他点燃了AI大模型这把火,但就本身的技术而言,很多技术已经是相对成熟的。所以我觉得重点是往后看,他们会怎么发展,会不会有新的技术路线出现?这些都是目前暂无定论的。但是无论如何,对于整个人工智能的发展,我觉得未来可能保持逐步加速态势。而且它的加速不仅限于人工智能技术本身的发展,可能还会加速不同的其他技术发展,比如说XR技术,再比如说自动驾驶技术。我们可能会看到新一轮科技周期爆发,我觉得这是我非常期待的。