深AI力量 | 云天励飞: “算法芯片化”推动大模型走向千行百业
转自:读创
文:读创/深圳商报记者 陈姝 通讯员 唐钰婷
图:读创/深圳商报记者 钟华登
大模型正在全球掀起一股浪潮,深圳人工智能企业正在探索如何让大模型深入千行百业,赋能数字经济发展。
在深圳龙岗政数局的行政服务大厅,大模型已应用于政务咨询服务系统。通过对海量的政策、法规、办理流程等文本进行结构化梳理和分析,形成易于查阅的知识库。帮助服务人员快速查询和获取准确的信息,减少查阅时间,提高工作效率。而在背后支撑的就是云天励飞技术股份有限公司名为“天书”的大模型。该公司透露,未来“天书”计划逐步拓展到其他政府机构和公共服务领域,如法务、金融、教育、医疗、交通等。
2014年在深圳成立,今年4月在上交所上市,9年时间,云天励飞从一个只有几位海归博士的小团队,已成长业内领先企业,走出了一条具有差异化特色的人工智能发展道路。
“万模大战”打响,“云天天书”应战
芯片和大模型已经成为人工智能产业的两大热门话题。芯片是算力的承载体,是亟待加大力度攻关的关键核心技术;预训练大模型被视为通用人工智能的雏形,是当前人工智能发展 的热潮。ChatGPT 问世以来,预训练大模型浪潮席卷人工智能行业,国内也掀起了大模型热潮。
在刚刚于上海闭幕的“2023 年世界人工智能大会”上,云天励飞首次展出“云天天书”。据不完全统计,目前国内已经发布了80多个大模型,其中有不少来自深圳,如华为“盘古”、腾讯“混元”、鹏城实验室“鹏城·脑 海”、IDEA 研究院“姜子牙”、云天励飞“天书”。
云天励飞董事长兼CEO陈宁认为,深圳已成为大模型培育的沃土。当前国内大模型处于“百花齐放、百家争鸣”的阶段,大模型的研发不仅关乎人工智能企业未来发展,更关乎一座城市未来生产力水平的提升。 因此,打造本地部署、自主可控的大模型产品至关重要。
云天励飞副总裁罗忆告诉记者,从模型垂类上来看,云天励飞将推出 NLP、CV、多模态等多类大模型。从模型分级上来看,“天书”基础大模型包含 L1层的通用大模型、L2层的行业大模型,以及L3层的场景大模型。 基于算法开发平台、算法芯片化平台,开展基础大模型研发,通过预训练生产通用大模型; 在通用大模型基础上,结合行业 know-how(技术诀窍),进行行业大模型训练;基于行业大模型,通过细分场景数据集进行微调,生产场景大模型。
从参数量级上来看,云天按照参数量级由小到 大的研发路径进行规划,包含百亿、千亿等不同量级大模型。针对不同场景应用需求,综合考虑时效性、准确性、部署成本等多种因素,匹配合适参数量级的大模型。 此外,高效的基础自研框架,根据不同行业和场景需求,采用合适规模的参数量级达 到理想的效果,有助于结合国产自研芯片拓展边缘侧应用。
让大模型走出办公室走向行业
云天励飞是业内少有的拥有芯片、算法和大数据全栈式能力的人工智能企业。陈宁本人是芯片专家,公司创始团队多来自集成电路领域,公司很早就将构建“算法+芯片+大数据”全栈能力平台作为未来发展的目标,“造芯”更是先于很多同行。
云天励飞在 2015年就已启动了与人工智能算法密切相关的神经网络处理器的研发。云天励飞副总裁、芯片产品线负责人李爱军告诉记者,从 2015 年至今,云天励飞完成了 3 代指令集架构、4 代神经网络处理器架构的研发,且已陆续商用。通过多年的投入,公司已建立起一支核心芯片团队,设计经验平均超过14年。
2018年,云天励飞的第一款可直接对外销售的芯片“深目”1000 流片成功,2019 年正式对外销售并实现商用。 去年底,云天励飞自主设计开发的新一代边缘计算芯片 DeepEdge10 成功流片。在“2023 年世界人工智能大会”上,DeepEdge10也进行了展示,它可应用于 AIoT 边缘视频、移动机器人等场景,预计今年量产投入使用。
云天励飞核心能力是“算法芯片化”。所谓“算法芯片化”不是“算法+芯片”,而是基于对场景的深刻理解,以及对算法关键计算任务在应用场景中的量化分析,将芯片设计者的理念、思想与算法相融合的AI芯片设计流程。这一理念在 Deep Edge10芯片和“天书”大模型上均有所体现。DeepEdge 10可为大模型在边侧推理场景提供充足算力,可以解决大模型应用和部署过程中的各类挑战,包括新的神经网络计算范式等,能够为大模型和实际应用场景嫁接起桥梁,让大模型技术能够高效、低成本地部署到终端,帮助场景探索更多创新应用。
“我们希望能够通过芯片将人工智能大模型的能力落地到更多场景中,让大模型不仅是一个只能在办公室中使用的产品,而是能够让它为更多行业和场景带来实实在在降本增效的价值。”陈宁说。
深圳为人工智能发展装“加速器”
云天励飞2014年在深圳成立,今年4月4日正式登陆科创板,成为“深圳人工智能第一股”。从最初几个人的创业团队,发展到如今近千人的企业;业务范围从智慧警务拓展到城市治理、智慧交通、智慧园区等领域;全球首套城市级动态人像识别系统、全球首款5AIOT芯片DeepEye1000、首次提出自进化城市智能体概念……云天励飞成长中的多个“第一”都离不开深圳。
陈宁曾不止一次在接受媒体采访时称赞深圳的营商及创新环境,并表示“深圳是全 国最适合海归创业的城市,没有之一;回国创新、来深创业,是这辈子最正确的决定,没有之一”。他也曾说:“深圳对云天励飞最大的支持就是向我们开放了人工智能市场,深圳的勇气和信任成就了我们。 ”
去年,我国首部人工智能产业专项立法——《深圳经济特区人工智能产业促进条例》正式实施;今年5月31日,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024 年)》发布,同步发布首批“城市+AI”应用场景清单,由此构筑起“一条 例、一方案、一清单、一基金群”的人工智能高质量发展和高水平应用的政策体系。
陈宁认为,深圳人工智能发展的优势和特色在于拥有活跃的市场,因此应当充分发挥这一优势,按照“应用产生数据,数据训练算法,算法定义芯片,芯片赋能应用”的思路,推动人工智能技术不断进步迭代。
“深圳的土壤孕育了云天励飞,深圳发布的各项政策无疑让人工智能产业发展装上了加速器”,陈宁说,未来云天励飞也将进一步加强技术探索结合现有的下游场景,开发出通用性更强、更智能化的大模型,让人工智能可以更好地赋能行业。
2021-2023年,深圳市政府工作报告连续3年提到建设“鹏城自进化智能体”,并被写入今年6月发布的《深圳市数字孪生先锋城市建设行动计划 (2023)》,成为深圳人工智能和智慧城市发展的重要指引,云天励飞的发展战略与此不谋而合。陈宁表示,将充分发挥大模型的泛化能力,快速拓展新场景,并通过应用落地,进一步反哺技术,技术场景双轮驱动,加快城市智能体自学习、自进化。