三六零创始人周鸿祎:垂直大模型单项能力对比通用大模型只强不弱
转自:封面新闻
封面新闻记者 雷强
“2023年的主旋律是如何做大模型,2024年的主旋律是如何用大模型”,1月24日,三六零集团创始人周鸿祎在长江商学院EMBA至诚讲坛上,以“2024大模型机遇年,企业如何拥抱AI”为题,面向企业家、创业者、管理者分享自己的大模型技术和产业发展观,系统阐述企业应当如何拥抱AI变革,并与长江商学院教授孙天澍进行对谈。
周鸿祎称,中国大模型的发展方向是产业化、垂直化,公有大模型无法直接在企业级场景落地,公有大模型的数据、知识只是人类知识的冰山一角,企业还有大量的“暗知识”,如战略规划、产品设计图等。在千亿大模型基础上“蒸馏”出来的百亿大模型,结合企业“暗知识”,经过垂直训练,才能深入企业级场景,满足企业需求。
“超过十项全能运动员很难,但单项技能可以实现超越,就像一个本科生,聚焦在垂直领域进行训练,也能超过一名老教授”,周鸿祎称,千亿大模型是“通才”,但是在单项技能上,经过专业训练的垂直大模型只强不弱,面向企业级场景的百亿参数大模型成本更低,性价比更高,更适用于企业级场景。
对谈中,对于大模型的落地,孙天澍提出企业应该如何兼顾场景与数据可行性。对此,周鸿祎认为,企业最重要的是要有知识,没有知识几乎不可能落地场景,企业可以构建大模型驱动的知识管理系统。企业用AI不能太冒进,要从众多场景中筛选出既有数据、知识,容错度又相对较高的场景,以此入手进行AI化改造。
周鸿祎详细阐述了大模型在企业级场景的落地方法论,首先,需要领导带头,人人普惠,大模型是“一把手工程”,领导既要重视,更要带头;其次,大模型最终要与业务融合,由业务驱动,企业是大模型应用的第一推动力;再次,要坚持“小切口、大纵深”,以大模型收效最大的突破点切入;最后,要先数转,再智改,“数字化做得越充分,大模型的作用就发挥得越彻底”,周鸿祎说。