蚂蚁集团CTO:大模型还处于钻木取火阶段,能用但太贵了
·Scaling law(尺度定律)在逃避一个现实,我们今天并没有找到AI产生如此效果的本质,没有人能用数学的方法描述它。这就好比钻木取火,火有用处,但钻木并非最好的方法。今天的AI依然处在钻木取火阶段,因此成本高昂。
“我开玩笑说没想到AI时代会以这么快的方式进入到 ‘补贴互联网’时代,但本质上来讲,技术价格一定会下降。”5月28日,在第九届蚂蚁技术日上,蚂蚁集团CTO何征宇表示,大模型仍处于钻木取火阶段,规模落地需要攻坚三大挑战:可靠性、经济性、易用性。
其中,可靠性是在技术层面用AI监督AI,以解决控制和“对齐”模型。经济性是把大模型做“小”,这决定了大模型应用能否成为主流。易用性则是将智能“傻瓜化”,进一步降低C端门槛,这决定了生成式AI是否能规模化落地应用,扎根C端。
可靠性、经济性、易用性
任何技术真正落地时必须解决可靠性问题,如果一个技术不可靠,便只是实验室产物或玩具。“今天AI在90%的时间里是可靠的,但10%的时间不可靠,说糊话、瞎话,这是不可靠的,AI生成式大模型必须克服这一点,否则它永远只是一个工具而不是产业。”何征宇表示,“蚂蚁集团资损率小于亿分之一,达到这种级别才能说改变了行业,能够进行规模化的技术适用。”
大模型时代,AI的可靠性要用AI监督AI,以解决控制和“对齐”模型。“大模型的每一个Token是预测出来,预测就一定会有误差,误差累积到一定程度,模型就一定会胡说八道。本质上是要控制数据流怎么流进模型以及怎么输出,实现足够小的误差范围,以及误差不要累积。”
“创投圈爱讲PMF(Product Market Fit,产品市场匹配度),但现在多了一个词,叫TC-PMF(Technology Cost-PMF,技术成本和产品市场匹配度),因为AI这个东西太贵了。”何征宇表示,之所以贵,是因为产生智能效果的方法有些笨拙,甚至不聪明。
“Scaling law(编者注:尺度定律,意思是随着模型、数据集、用于训练的计算浮点数的增加,模型的性能会提高)在逃避一个现实,我们今天并没有找到AI产生如此效果的本质,没有人能用数学的方法描述它,找到它的规律。” 何征宇认为,这就好比原始人钻木取火,火有用处,但钻木并非最好的方法。今天的AI依然处在钻木取火阶段,因此成本高昂。
在巨大资源投入下,云厂商免费提供API(应用程序编程接口),国内大模型已从参数规模、性能指标“卷”到了Token价格,大模型掀起价格战。“我开玩笑说没想到AI时代会以这么快的方式进入到 ‘补贴互联网’时代。但本质上来讲,技术价格一定会下降。”尽管何征宇认为这是逆市场行为,但代表了大量资源涌向大模型领域,蚂蚁也会继续沿着这条路投入资源。
“另一方面,我们需要尝试寻找一条真正的路。我们站在中国科技的角度,而不只是站在全世界大同的角度,我们迫切需要第二条路。如果我们紧跟着Transformer这套紧耦合的算法结构+芯片路线,弯道超车非常难,我们必须要有新的方法、新的理念、新的探索。”何征宇表示,蚂蚁集团正在积极投入,最终目标是产生能够超越这一代人工智能的能力。
在何征宇看来,任何一个技术要真正面向全体大众生根发芽,技术门槛必须足够低,做到易用。“今天的AI如果要成为超级入口,必须要进一步降低C端门槛。如果还在想着怎么用更好的提示,让ChatGPT的反应更好一点,这意味着它的门槛太高了。”易用性是要将智能“傻瓜化”,这决定了生成式AI是否能规模化落地应用。
AI不为替代人而生
基于大规模业务场景需求,蚂蚁布局了知识图谱、运筹优化、图学习、可信AI、大模型等AI技术,蚂蚁百灵大模型去年底完成备案,生活管家“支付宝智能助理”、金融管家“支小宝”、数字健康人“安诊儿”三个智能管家是蚂蚁百灵大模型的核心创新应用产品。
“很多产品从To C角度讲,似乎很难让每一个人都获益。但我们希望AI像扫码支付一样,能够便利每个人的生活。”何征宇表示,AI不为替代人而生,也不能变成少数人的AI,而是为每一个人而生。
“以生活管家支付宝智能助理为例,它连接了400万商家机构小程序和8000项数字生活服务,食住行游购娱等生活服务均可问可办。”何征宇表示,“这就是每个人都需要的便捷工具。”此外,浙江省卫健委与支付宝联合推出了可陪诊的数字健康人“安诊儿”,浙江省内用户就医时可感受全流程的陪伴、指引、互动。 “浙江省人民医院跟我们说,用了 ‘安诊儿’后,一楼导诊台流量下降了50%,特别是对老年人、异地就医患者比较友好。我们不仅仅将数字化转化为智能化,而且更好地消灭数字鸿沟。”
何征宇表示,“现在大模型大多数在打榜、做奥数题,智能管家并不需要奥数冠军,而是需要极其靠谱。我们深耕的是严谨产业,我们更加希望大模型是一个靠谱的大模型。”他希望三个智能管家规模化服务亿级用户,端侧模型配合云侧模型,降低成本。