华泰证券:Kimi能否点亮国产大模型的未来?

查股网  2024-03-26 09:47  华泰证券(601688)个股分析

核心观点:

Kimi流量高增,有望加快国产大模型C端应用落地

Kimi自2023年10月推出以来,其长文本处理能力使其于众多模型中脱颖而出。据Similarweb数据,截至3月22日,Kimi网页版日活用户数峰值达34.6万,周活数据环增45%。据Sensor Tower数据,Kimi chat在Iphone免费榜单中已迅速攀升至21日的应用总榜第5,生产力榜单第1。据七麦数据,其3月22日单日下载量超11万,环比增长140%。Kimi流量持续高增,有望加快国产大模型C端应用落地。

商业化+多模态为Kimi迭代方向,长文本优势突显

Kimi自2023年10月推出后,历经三次版本迭代。据钛媒体3月18日报道,Kimi预计24年上半年开启商业化模式。联合创始人周昕宇同时表示,预计2024年会推出多模态模型及产品。Kimi长文本优势领先,长度已扩展至200万字,可实现上下文记忆、准确信息、复杂任务处理、减少信息碎片化、对话多轮连贯功能。其战略重心为基于闭源的C端模型,加速模型迭代,也让B端公司接入其API合作赋能。

阶跃星辰接力发布Step系列通用大模型,国产大模型未来可期

阶跃星辰自23年4月成立来一直深耕自研超级模型,目前已完成Step-1千亿参数语言大模型和Step-1V千亿多模态大模型研发。2024年3月23日,公司于2024全球开发者先锋大会上正式对外发布Step-2万亿参数MoE语言大模型预览版。其Step系列通用大模型在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到业界领先水平,目前公司已基于其Step系列通用大模型推出“跃问”工具和“冒泡鸭”AI开放世界平台。

国产优质大模型能力持续进阶,有望推动国内AI应用快速发展

国产AI优质大模型能力优秀,未来应用可能落地场景涵盖内容创作、智能搜索、教育、阅读、视频、营销、电商、智能助手等方面。产业链相关传媒公司梳理如下:1)素材库价值凸显,视频语料库及文本语料库相关公司。2)Kimi赋能应用逻辑的相关公司。3)与其他国产优质大模型合作逻辑的相关公司。具体名单请见研报原文。

风险提示:国产大模型能力发展不及预期,应用场景发展不及预期等。

正文

Kimi Chat流量高增,有望加快国产大模型C端应用落地

Kimi Chat自2023年10月推出以来,以其优异的长文本处理能力在AI助手中脱颖而出。至2024年3月,Kimi Chat的各项流量数据均显著增长。

1. 活跃用户数方面,根据Similarweb数据,截至3月22日,Kimi网页版日活用户数当前峰值日活达34.6万,周活数据环比增长45%。

2. App排名趋势方面,根据senor tower数据,iPhone免费榜单中Kimi chat已从3月9日400名以外迅速攀升至21日应用总榜第五,生产力榜单榜首的位置。

3. 下载量方面,根据七麦数据,3月22日单日下载量超11万,较3月21日增长140%。

Kimi将如何迭代?商业化及多模态是下一步

Kimi是母公司月之暗面推出的智能助手产品,首次亮相于2023年10月的产品发布会,推出时是全球首个支持输入20万汉字的智能助手产品,底座模型为千亿参数级大模型moonshot。11月Kimi Chat全面开放。在之后进行了多次版本的更新:

1. 2023年12月26迭代:

1)新版本模型发布,回复速度提升;2)识别扫描件,实现了从扫描件(文档、合同、白板等等)提取文字的功能。支持PDF格式的扫描文件上传解析;3)上架小程序:Kimi智能助手;4)网页端浅色模式上线。

2. 2024年1月26日迭代:

1)基础模型能力全面升级:联网搜索能力,模型现在可以更智能地判断是否需要联网读取网络资料来回复你的消息;搜索网络资料时,也会优先访问更高内容质量的网页。上下文学习能力,遇到复杂任务时,在输入中提供几个需要模型完成的任务“示例”,Kimi Chat会更懂你想要的输出结果。文学创作能力、语言翻译能力;2)Kimi回复消息时的“打字”速度快了近一倍;3)小程序版Kimi智能助手已支持语音输入,中英文都可以。

3. 2024年3月18日迭代:

3月18日起,支持 200 万字上下文的 Kimi 已启动“内测”。对大模型超长无损上下文能力有需求的用户,可到 Kimi 智能助手网页版 kimi.ai 首页申请抢先体验。具体提升:1)上下文长度扩展到200万汉字;2)相同成本、相同设备情况下,模型响应速度提升了3倍左右。

预计Kimi未来的发展方向将是初步商业化与实现多模态。1)商业化:2024年3月18日,月之暗面副总裁许欣然在接受钛媒体采访表示,24年上半年预计开启商业化模式,但月之暗面商业化的出发点并非基于性价比,而是在帮助用户解决问题的基础之上,将商业化不断开放和规划。2)多模态:2024年3月18日,月之暗面联合创始人周昕宇在接受钛媒体采访时表示,Sora出来以前,月之暗面就在根据自己的节奏推进多模态能力的研发,Sora的出现也并没有打乱原有的安排。预计2024年会推出多模态模型/产品。

如何理解Kimi的差异化?长文本+闭源+C端

长文本:上下文长度扩展到200万汉字,显著提升Kimi处理文本数据性能

对比国内外代表大模型,Kimi长文本能力处于头部水平。Open AI发布的GPT-4、GPT-4 Turbo上下文长度分别为32k、128k;Anthropic发布的Claude 3 Opus将上下文长度增加至200k;谷歌发布的Gemini 1.5上下文长度增加至1000k。Kimi Chat在长文本上具备显著优势,3月18日版本更新后能够支持约200万字(约为2500k)无损上下文长度。

月之暗面创始人杨植麟认为,上下文长度就是大模型的“内存”,它是决定大模型应用最关键的两个因素(参数量和上下文)之一。长文本技术的关键优势包括:

1)上下文记忆:Kimi智能助手能够记住和理解长达20万汉字的上下文信息,这意味着它可以处理和分析长篇文档,如研究报告、合同、法律文件等,而不会出现信息丢失或断章取义的情况。

2)信息准确性:由于能够维持对长文本的准确记忆,Kimi在回答问题时能够提供更加精确和全面的信息,减少了因为上下文不足而导致的误解或错误。

3)复杂任务处理:长文本技术使得Kimi能处理更复杂的任务,例如:分析多页的财务报告、理解复杂的法律案例或者参与长篇的角色扮演对话。

4)减少信息碎片化:在处理长文本时,Kimi可以通过一次性输入大量信息,而不是将文档分割成小块,从而避免了信息碎片化,提高了工作效率。

5)多轮对话和连贯性:在进行多轮对话时,Kimi能够利用长文本技术记住之前的对话内容,保持对话的连贯性和上下文的一致性,为用户提供更自然的交互体验。

重点打造闭源C端模型,B端公司合作接入其API

和其他AI大模型的TO B路线不同,Kimi的战略重心在于TO C,模型为闭源。此外,月之暗面的开放平台是面向所有开发者和企业用户开放的,任何合规的开发者和企业,都可以将Kimi智能助手背后的同款大模型API接入到自己的产品或服务中,基于Kimi大模型的长文本处理和指令遵循能力,升级或打造全新的、有创造力的产品或服务。

在Kimi chat发布之初,月之暗面表示,更长的上下文长度可促使大模型从LLM时代进入Long LLM (LLLM)时代:

1)每个人都可以拥有一个具备终身记忆的虚拟伴侣,它可以在生命的长河中记住与你交互的所有细节,建立长期的情感连接。

2)每个人都可以拥有一个在工作环境与你共生(co-inhabit)的助手,它知晓公域(互联网)和私域(企业内部文档)的所有知识,并基于此帮助你完成OKR。

3)每个人都可以拥有一个无所不知的学习向导,不仅能够准确地给你提供知识,更能够引导你跨越学科间的壁垒,更加自由地探索与创新。

阶跃星辰Step系列通用大模型面世,开启AI新篇章

上海阶跃星辰智能科技有限公司于2023年4月成立,坚定自研超级模型,已完成Step-1千亿参数语言大模型和Step-1V千亿多模态大模型的研发,在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到业界领先水平。2024年3月23日,阶跃星辰于2024全球开发者先锋大会上正式对外发布Step-2万亿参数MoE语言大模型预览版。

跃问:领先的多模态理解+超强的逻辑推理+精确的超长文本理解

跃问是基于Step-1和Step-1V千亿参数大模型的一款产品效率工具,其在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到业界领先水平,具备领先的多模态理解能力、超强的逻辑推理能力和精确的超长文本理解能力,可实现功能包括:1)准确理解真实图像,高效生成精彩文案;2)深入分析数据图表,实现复杂逻辑推理;3)主动触发智能搜索,高效捕获精准信息;4)精准理解长文内容,快速总结核心观点等。

冒泡鸭:AI开放世界平台,提供创意互动性体验

冒泡鸭是基于Step系列千亿参数模型研发而成的AI开放世界平台,具备语音输入和识别功能,允许用户在一个开放的环境中探索故事、创造角色,提供富有创意和互动性的体验。可实现功能包括:1)故事探索:用户可在冒泡鸭中探索各种故事线,这些故事由AI生成或者由用户自己创造;2)角色创造:用户可根据自己的想象来设计和定制角色,包括外观、性格、背景故事等,定制独一无二的AI智能体;3)智能聊天交流:与用户进行自然语言交流,覆盖科技、教育、经济、娱乐各个领域的知识,可为用户解答疑惑等。

前景及投资建议:Kimi等应用场景丰富,AI应用产业链受益

Kimi作为一款多领域智能助手,其在长文本处理上具有领先优势,未来的创新应用落地场景涵盖了学习教育、法律咨询、财务分析、代码开发、内容创作、智能搜索等多个方面。

个性化学习与教育方面,Kimi可以根据用户的学习进度和偏好,提供定制化的学习材料和辅导;

法律咨询与分析方面,通过上传相关法律文件,Kimi能够提供法律问题的初步分析和建议,帮助用户理解法律文本和案例;

财务分析方面,Kimi能够分析和总结公司的财务报告,帮助用户快速把握公司的财务状况和历史发展节点;

代码开发方面,将有助于开发人员及时复盘,快速纠错,并提供建议;

内容创作方面,Kimi可以帮助作者梳理长篇小说、剧本等内容,挖掘细节并提供创作灵感和编辑建议。我们介绍其中两种场景:

1、长文字处理与生成:长文本能力突破200万

Kimi支持TXT、PDF、Word文档、PPT幻灯片和Excel电子表格等多种文件格式,在长文本能力上实现突破后,实现多轮复杂对话、完成超长复杂指令、整合更多网页信息等方面表现均有所提升,应用落地场景有望扩大。

例如:

1)构建专业Agent:Kimi能够整合和理解整本专业书籍的内容,降低了创建专业智能代理的门槛,甚至可跨越不同领域,实现知识的综合运用和解读。

2)IP衍生:大多数文学作品能够直接提供理解,从而实现人物对话、书籍导读、解析等效果,也可以用于打通与其他AI生成功能如文生图、文生视频的联系。

3)游戏/影视创作:可进一步辅助游戏策划或影视脚本环节的长文本设定(如世界观、人设、故事梗概)的理解,从而改进后续开发和拍摄的实现效果,也可直接用于智能NPC、AI剧本杀的设计。

2、代码辅助与数据处理:解析网页内容整合结果,支持跨平台和多语言开发的助手

Kimi在代码辅助与数据处理方面的应用前景展现了强大的潜力和多样化的发展方向。

1)在代码辅助领域:Kimi能够通过自动生成代码模板、提供代码审查与优化建议、辅助错误检测与调试、指导API使用与集成,以及作为编程语言学习的智能导师,显著提升软件开发的效率和质量。这些功能不仅能够帮助开发者快速实现想法,便利自动化代码测试与注解,还能确保代码的健壮性和可维护性,提供技术栈迁移和系统重构的帮助。

2)在数据处理方面:Kimi能够直接搜索网页并分析总结多个相关页面,一次性可处理500+的文件数量,并协助进行数据分析与可视化,在如社交媒体数据、金融市场数据等,为企业提供市场趋势预测、用户行为分析等大规模数据集上应用前景广阔,使得复杂的数据集变得易于理解。

我们认为,Kimi能力快速迭代及阶跃星辰Step-2万亿参数MoE语言大模型预览版,显示国产大模型行业能力在快速提升,有望赋能千行百业应用场景,应高度重视。我们认为产业链相关的传媒应用投资机会主要有三条逻辑:

1、AI大模型依赖多样化训练数据,高质量视频/语料素材库价值凸显

多模态大模型的进化依赖于大量多样化的训练数据持续投喂,包括后续Kimi等国产大模型多模态的模型训练也需要视频、语料素材库。

从海外来看,Shutterstock具有全球知名的图片、视频和音乐素材库,其素材具有高分辨率和创意性。据Shutterstock官网,其与OpenAI在22年10月签署六年合作协议,允许OpenAI在合作期间使用Shutterstock平台内的图片、视频和音乐素材来训练AI模型。据美通社,23年7月二者进一步扩大合作,OpenAI获得了访问更多数据的许可。

此外,24年3月20日,法国竞争管理局裁定对谷歌罚款2.5亿欧元,主因谷歌未经通知使用了法国媒体出版商和新闻机构的内容训练聊天机器人,违反欧盟知识产权规则。随着大模型发展优化,视频/语料素材库的价值有望放大。

1、 视频语料库

2、 文本语料库

我们对相关公司进行梳理,具体请见研报原文。

2、接入Kimi等AI大模型,助力应用场景发展

应用接入大模型,有助于提升用户体验、扩展应用场景以及创新商业模式。以Kimi为例,基于Kimi的长文本理解及处理能力,有望推动在线阅读、教育、营销、电商、内容创作等多场景体验优化、效率提升。

我们对相关公司进行梳理,具体请见研报原文。

3、与其他优质国产大模型合作的公司,有望通过优质大模型提升主业

我们对相关公司进行梳理,具体请见研报原文。

风险提示

1)国产大模型能力发展不及预期

国产大模型可能在算法创新、模型优化和多模态能力提升面临发展瓶颈,技术进步速度不及预期会影响国产大模型的应用推广及商业化进程。

2)应用发展不及预期。

存在特定行业由于专业性和复杂性问题导致大模型应用探索不及预期的可能,这将进一步影响其实际应用效能和商业化进程。