星环科技孙元浩:坚持“产品为王,技术必胜”,超级科幻迷的颠覆式创新之路
转自:上观新闻
在科幻小说《三体》中,“星环集团”聚集了人类最优秀的一批科学家,在太阳系遭受“维度攻击”时,建造成太阳系的第一艘超光速飞船——星环号,成为太阳系文明得以延续的希望。现实中,一家来自漕河泾开发区的企业以此为名,希望聚集一批优秀的工程师和科学家,打造世界上最好、最快速的大数据处理引擎。它,便是星环信息科技(上海)股份有限公司(以下简称“星环科技”)。
星环科技是一家企业级大数据基础软件开发商,在分布式、多模型、云原生技术上实现技术超越和引领。目前,星环科技已累计超过1400多家终端客户,覆盖政府、金融、能源、电信、交通及制造业等领域。
2022年10月,成立9年的星环科技迎来了高光时刻。随着创始人兼CEO孙元浩及团队在上交所敲响铜锣,星环科技正式登陆科创板,成为“国产大数据基础软件第一股”。而早在创业初期,孙元浩就曾说过,“中国基础软件行业中的核心软件,必然由中国公司来研发”,如今看来,这位超级科幻迷的预言也正逐渐照进了现实。
“大数据软件国产化,势在必行”
2013年,正值中国的“大数据元年”。彼时,大数据被视为创新和生产力提升的下一个前沿,是国家竞争力的核心要素之一。也是这一年,任职英特尔数据中心软件部亚太区CTO的孙云浩选择离开服务了10年的外企,创办星环科技。选择创业的原因,除了对大数据技术研发的满腔热情,更重要的是,孙元浩及团队看好中国大数据产业的广阔前景。
他认为,早年IT技术以集中式软件为主,在未来的二十年,以群体智能化为特点的分布式技术会逐渐取代集中式软件,整个IT行业软件栈会发生重构,从操作系统到数据库、数据软件,再到中间件及应用软件都将迎来颠覆性的变革。“过去,大数据系统软件话语权长期被国外巨头掌握。我们判断,以中国巨大的数据量及应用的复杂性,大数据产业的发展将远超其他国家,这也意味着大数据系统软件国产化,势在必行。”孙元浩回忆道。
以此为使命,孙元浩及团队坚持深耕大数据系统软件赛道,而这是一条从未有中国企业走过的路。他比喻道,“就像爬山一样,只有坚持爬过最陡峭的山峰,才能看到更美丽的风景。”
据介绍,星环科技的早期产品和解决方案都是基于英特尔开源Hadoop产品所构建,随着大数据项目的不断落地,孙元浩及团队越发意识到开源产品已无法适应硬件的快速发展。为了突破大数据技术瓶颈,孙元浩及团队决定颠覆国外软件,通过自主研发来取代开源技术。“我们创业的初衷是希望做一家有竞争力的公司,沿用开源软件意味着我们无法与其产生差异化。只有另辟蹊径,且做得比他们更好,才能生存下去。”孙元浩说。
可以想象,全面走向自主研发的星环科技,面临着不少挑战和困难,而没有开源软件架构的掣肘,星环科技也更易在技术上获得突破。
经过多年努力,目前星环科技已基本完成了各种产品和解决方案中开源组件的替换,形成了大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵。其中,大数据平台TDH在2018年3月成为全球首个通过TPC-DS基准测试并经过TPC官方审计的数据平台。根据工信部电子第五研究所代码扫描测试报告显示,大数据平台TDH的1200万行代码中自研代码率超70%,分布式数据库ArgoDB代码自主率(行数)超过90%。
“产品为王,技术必胜”
创业路上,孙元浩一直以来都有着一个坚定的信念,即“产品为王,技术必胜”,这也是星环科技能在大数据软件行业激烈竞争中脱颖而出的制胜法宝。在孙元浩看来,聚焦关键技术,并以市场需求为导向做研发,把产品做到极致,方能赢得客户的青睐。
进入大模型时代,星环科技在AI和数据技术领域深厚的积淀使其迅速推出了可落地的产品,在大模型应用方面,授人以鱼,也授人以渔。
针对通用大模型无法理解行业术语、不能执行行业特定任务等痛点,星环科技推出大模型持续提升和持续开发工具Sophon LLMOps,在原有Sophon MLOps机器学习模型全生命周期管理的工具平台基础上,针对大语言模型及其衍生数据、模型、应用问题,提供了相应的增强,形成了LLMOps工具链,该工具链拥有样本仓库能力、模型运维管理能力、大语言模型和其他任务的编排、调度和上线能力。Sophon LLMOps的推出,不仅弥合了通用大模型和行业间的巨大鸿沟,更推动数智平民化发展,让各行各业都能打造属于自己的模型。
同样,星环科技于近期推出的金融大模型“无涯”,以及数据查询分析智能助手“求索”,旨在解决大模型在金融等特定领域只是一名“实习生”的痛点。据介绍,造成“实习生”专业知识储备不足的客观原因,一是训练时间长,实时资讯及市场行情难以内置于大模型中;二是大模型的输入均有字数限制,若将上市公司年报全部放入即可能超限,导致大模型“罢工”。为此,星环科技以向量数据库(vector databases)作为支撑,承担中间存储的角色,将最新的、经常变化的信息放入向量数据库。当提问大模型时,先把问题转成高维向量,进行语义搜索,找到相关信息,再把它拼接成提示词发给大语言模型,由大模型生成答案。这样一来,“无涯”可回答研报分析,对个股、债券、基金等各类市场时间进行复盘和推演;通过“求索”大模型,数据工程师及业务人员等可用自然语言与数据库“对话”,大大提高便利性,让每个人都能拥有“虚拟业务助手”。
“携手共筑产业生态”
作为在漕河泾开发区诞生及成长的科技企业,星环科技的发展
始终与园区发展同频共振。被问及为何选择在漕河泾创业,孙元浩坦言,起初是因为“离家近”;而今,“氛围越来越像硅谷”是孙元浩对开发区的新印象,具有漕河泾特色的科创服务及园区内不断释放的创新活力,都让他无悔于当初的选择。
据了解,漕河泾开发区从星环科技成立之初便从科技金融、政策申报、品牌宣传等多个方面为企业的成长保驾护航。漕河泾创业中心党总支和星环科技党支部更签署了“漕河泾重点企业服务专班”协议书,成立党建星环服务专班,先后在张江重点项目资金申报、企业上市辅导、知识产权高价值专利组合研究、园区大数据场景合作、创新联盟、产学研平台合作等方面助力企业发展。
不仅如此,漕河泾开发区所属的临港集团,每年举办“园区科创之星”及“园区科创英才”评选,以表彰集团旗下园区优质科创企业及科创企业家,并通过开展颁奖活动、成立专项服务队伍、对接科创服务资源、组建集团孵化服务基金及组建创新联盟与场景合作生态等方式,进一步助推企业实现跨越式发展。
在近日举行的2023临港创新发展大会上,孙元浩获颁“2023年度临港集团园区领军英才”。激动之余,他感言道:“在漕河泾这样的科创热土上,创意要素加速集聚,只有通过交流相互促进,创新技术才能得到更快发展。期待与园区及行业企业共同携手,共筑数字产业新生态。”
栏目主编:崔家琛 文字编辑:陈敏
专题