昆仑万维方汉：大模型领域创业者要试错“独特思考快速失败”

http://ddx.gubit.cn 2023-05-18 20:15 昆仑万维(300418)公司分析

5月18日，已发布大模型“天工”的昆仑万维在其官方公众号上发布了其CEO方汉对生成式AI的观点。

方汉认为，生成式AI的瓶颈在于数据层面，数据门槛仍然非常高，而大模型未来的商业模式无非是降本增效。对于行业来说，需要尽快拥抱大模型，做自己行业的专有大模型，并特意表示“不建议游戏行业使用AIGC，更应关注如何用AIGC技术提高游戏性”。此外，他看好多模态在大模型工程上的前景。

以下为方汉第一人称叙述的精华观点。

生成式AI的瓶颈与潜能

从数据与技术两个角度来看，我认为老技术没有壁垒。现在所有的新技术都在踊跃出现。我观察到，目前各种论文、所有最创新的研究是在读博士生开展的，目前所有基于大模型的创新都是在读博士甚至硕士做出来的，很多技术迭代非常快，谁跑得更快，谁就有机会。

老的数据门槛仍然非常高，所有大模型都需要行业数据。我们知道，行业数据都是被各个行业巨头所垄断的，这种数据有一个问题，它是老的格式数据，如何把老的数据尽快转化为大模型能够处理的新数据，这对于各行各业都是一个关键的问题。

举个例子，OpenAI的机密其实是它如何处理数据。例如，用大模型控制前线美军小队完成一个战斗任务，而且这个战斗任务持续几个小时，非常复杂，为什么能做这件事情，因为美军有一个习惯，会把每次战斗做非常详细的Report，大量的Report是非常好的行业数据，能够模拟人类做决策。

而行业数据普遍存在的问题是什么？很多行业数据往往只有条件和结果，没有过程。这导致了大模型只能背结果，它不知道如何达到这个结果，缺乏过程。所有的行业，如果要把过程给补上，这项工作是非常痛苦的，但是这项工作不得不做。

因此，我认为行业大模型的价值其实不在于做大模型本身，数据层面反而是一个特别苦、特别脏的活，所有的行业都要走一遍这个过程。

至于大模型未来的商业模式，太阳底下无新事，无外乎是降本增效。

行业如何落地大模型？

对于行业而言，我认为可以尽快拥抱大模型，做自己行业的专有大模型。

例如，医疗行业，我觉得分两种公司，一种是现在它有很多专有的行业数据，这个是必须的；

另外，如果没有专有数据，那么有一个蓝海，英文行业数据的知识迁移通过大模型来实现目前非常容易，这对中小公司创业很有帮助。

我对游戏行业比较熟悉，我非常不建议用AIGC在游戏行业的2B应用。我觉得，所有人更应该关注的是如何用AIGC技术提高游戏性，这个得到的回报永远是最大的。

看好多模态在大模型工程上的前景

人类所有的智慧绝大部分是用文字记录，现在多模态的图像、视频包含人类智慧的含量特别少。大家平时在短视频平台看到的内容大部分是娱乐八卦信息，有多少智慧在里面？含量是非常少的。

我的观点，多模态大模型不会增加对人类智慧的应用，大模型研发到末期了，人类的高质量的语料快用完了。行业现在只是想办法把这些高质量的文字砸出更多的价值。

但是从工程角度来说，图片跟视频这种多模态大模型应用上就特别有价值。我们做多模态大模型，能够挖掘出来更多目前文本大模型不具备的一些工程能力，但是在人类智慧上，进步没有那么大。

但我们不用追求形式上的完美，有可能它本来就是不完美的。我是核物理专业，我了解爱因斯坦包括杨振宁最后的工作，都是把集中基本力统计起来，但并不妨碍我们做出各种各样花里胡哨的工程上的应用。所以，我很看好多模态大模型在工程上的前景，但我不认为它们能够带来大模型在智慧上的跃进。

最后，大模型领域的创业者，一定要寻找用户的刚需，快速挖到自己的第一桶金，要快速迭代、不断试错，不要只钻一个方向。

独特思考，快速失败。

新京报贝壳财经记者罗亦丹

编辑徐超

校对柳宝庆

昆仑万维方汉：大模型领域创业者要试错“独特思考 快速失败”