海天瑞声张哲:大模型范式变革不可逆 坚定投入大模型标准化数据集建设
《科创板日报》7月21日讯(记者 张洋洋) 2023科创板开市四周年论坛今日在上海举行。本届论坛由上海报业集团指导,《科创板日报》联合财联社主办,以“硬核驱动 数字创新”为主题。
在圆桌对话环节,海天瑞声证券部总经理张哲对公司的大模型业务布局进行了分享。
海天瑞声主要是为人工智能的模型训练提供数据支撑。张哲称,过往6个多月的时间,以OpenAI为代表的技术路线,把AI应用端的天花板一下子打开,给了大家很大的想象空间。
“基于这半年跟国内前十大已经宣布要做大模型厂商的深度交流,我们逐渐把一件事情想明白了,既然范式级别的变革是不可逆的,如果海天不把这个时间窗口抓住的话,可能下一个5年-10年竞争当中,很难再保持过往10年的市场地位。”张哲表示。
也因此,在6月21日,海天瑞声发布了7.9亿元的定增方案。“我们也是下定决心想通过这次再融资的方式,围绕两个方向发展大模型相关业务”,谈及该定增计划时,张哲如是说到。
具体而言,一个是坚持现有的商业模式的最大特点,做标准化的自由产权数据集,一次性投入建设,未来市场上只要有需求,海天瑞声就可以多次重复售卖,尤其是遇到特殊时期,没办法做定制化项目的时候,标准化产品对于客户刚需是非常好的一个支撑。
张哲表示,在大模型领域专有数据集上,海天瑞声将建设不少于10个品类,涵盖通用及垂直领域的多语言模型;另外则是面向多模态,这是打开更大市场空间的切入点,海天瑞声现在已经在包括自动驾驶领域等多场景,做大模型标准化数据集建设。最后则是评测,主要是在评测大模型能力能力高低时,从数据集的角度给予支撑。
另外一个方向则是,海天瑞声也要建设自己的大模型。张哲称,该大模型是面向数据处理行业,主要用于提升未来大模型范式下,数据处理的自动化水平,当客户的需求从通用领域往各个垂向拓展的时候,数据端的支持能跟得上。但目前,这个大模型还没计划对外,仅对内使用。