行业大模型、向量数据库···星环科技CEO孙元浩:每个人都需要一个“虚拟业务助手”
以ChatGPT为代表的超大语言模型的迅速应用,加速了AI普及,让AI伸手可及,并开始走进我们的工作和生活。毫无疑问,AI大模型等技术已经深刻地影响到所有行业的发展,并正在重构企业核心产品,重塑用户与企业产品和服务的交互方式。
“向星力·未来数据技术峰会(FDTC)”日前在上海举办。星环科技创始人、CEO孙元浩表示,未来人人都是数据科学家,人类与数据的交互方式将发生重大变革,语言、视频等自然语言的交互方式将逐渐普及,每个人都将需要一个“虚拟业务助手”。
孙元浩判断认为,未来数据处理将走向智能化、多模态和平民化,其中领域大模型让数据处理的自动化程度更高、结果更能为我所用;数据处理将从单一模态向多模态进化,企业数据分析来到新的次元;数据处理平民化,让普通人不再需要掌握复杂工具,就可以快速处理数据。
提供大模型训练工具,每个企业都能打造自己的专属大模型
ChatGPT主导的对话式AI开始渗透到各行各业,使人和信息结合比以往任何时候都更紧密。超大模型虽好,但是训练、维护的技术要求高、训练难度大,费用巨大,同时通用大模型对于特定领域的适用性不佳。
为此,星环科技在行业内首先提出行业大模型应用创新场景,推出相应的工具,帮助企业构建自有的行业大模型,通过大模型基础设施,形成具备“新型人机交互”且“敏捷可持续迭代“的人工智能应用。
为了帮助企业用户基于大模型构建未来应用,星环科技推出了Sophon LLMOps,帮助企业构建自己的行业大模型。具体来看,它解决了客户三个核心痛点:第一,提供一站式工具链,帮助客户从“通用大语言模型”训练/微调,得到“满足自身业务特点的领域大语言模型”;第二,帮助客户将原型的大语言模型应用,成功在实际生产中投入应用;第三,帮助客户运营在生产中应用的大语言模型和大模型的持续提升。
除此之外,星环科技在行业首先推出了两大行业大模型:服务于金融行业的星环金融大模型无涯,以及大数据分析大模型SoLar “求索”。
其中,服务于金融行业的星环金融大模型无涯让人印象深刻。从星环科技在发布会上展示的功能来看,它已具备对包括基本面、技术面、消息面在内的金融通识领域准确的理解能力。孙元浩指出,星环科技积累了上百万金融专业领域的语料,基于对图数据库、深度图推理算法的技术,形成了大规模高质量的金融类事件训练指令集,二者共同铸就了开发金融领域大语言模型的坚实底座。
多模态的数据处理,让每个人都拥有个性化的AI助理
数据处理从多模型向多模态转型,从单一模态向多模态进化,企业数据分析来到新的次元。
为了适应这一全新转变,星环科技推出了自研的向量数据库,拓展大语言模型时间和空间维度。使用星环科技的向量数据库+分布式图数据库,可以构建基于大模型的应用,让每个人都拥有自己个性化的AI助理。
向量数据库由于与AI大模型的协同作用而以惊人的速度流行起来。最古老的数据库类型是SQL或关系数据库,其中所有的数据都结构化的。Web 2.0公司不断增长的需求引发了NoSQL革命,数据库变得更加灵活,出现了能够处理更多非结构化数据的数据库,能够的处理数量更加庞大。现在,随着市场对人工智能应用的追捧,出现了另一种被称为向量数据库(vector databases)的新市场。AIGC热更是将加速了向量数据库的投资热。
在本次峰会上,星环科技推出自研的向量数据库Transwarp Hippo。作为一款企业级云原生分布式向量数据库,星环Hippo支持存储、索引以及管理海量的向量式数据集,能够高效地解决向量相似度检索以及高密度向量聚类等问题。
大模型技术带来的启发,图神经网络技术的日益发展,为图智能的发展提供了沃土,为图库和图智能结合提供了探索的机遇。大数据时代,应该如何解决海量图数据的存储、计算难题呢?星环科技打造面向图智能、业务分析的多模型企业级分布式图数据库StellarDB 5.0。StellarDB 5.0实现了实时短查询场景5倍提升,高并发上万+QPS,近50种图算法,平均8倍性能提升,多度关联关系场景10倍提升,解决无限扩层问题。
数据处理平民化,让人人成为数据科学家
让普通人不再需要掌握复杂工具,就可以快速处理数据,这是数据处理平民化的一大追求。而星环科技在不同的产品上创新,使得落地数据处理平民化。
星环大数据基础平台TDH,打破湖仓集的边界,让更多人可以访问实时+历史/原始+加工后的数据;星环数据基础平台TDH 9.3多模型统一架构迭代升级,支持统一查询处理语言完成跨模型数据流转与关联分析,业务开发更便捷;星环TDH底座就地升级到星环TDC,不仅释放运维人员的时间与精力,而且提升运维效率;星环科技数据流通平台Navier 3.1三大产品同时升级,让数据流通更便利、更安全、更可控;国产化替代上更进一步,为用户创造新的价值……
大数据产业发展的下一步就是打造以平台为核心的大数据生态。星环科技坚持“平台+生态”的发展理念,与软件开发商、硬件开发商、系统集成商等生态伙伴积极合作,打造更多领域的联合解决方案,扩大产品市场影响力,提升竞争力,打造大数据基础软件产品应用的生态体系。
未来已来,数据处理的智能化、立体化、平民化大潮汹涌澎湃,而利用创新技术落地数据处理的产品则是这些浪潮落地的基石和基础,正在改变数据处理发展的进程。
作者:徐晶卉
编辑:周渊
责任编辑:唐玮婕