岩山科技子公司发布全新通用大模型
本报记者 施露
1月24日,上海岩芯数智人工智能科技有限公司(下称“岩芯数智”)发布Yan架构通用大模型。
据岩芯数智CEO刘凡平介绍,Transformer作为GPT、LLaMA等大模型的基础架构,仍有算力消耗等缺陷。岩芯数智的研究团队历经近1000多个日夜的努力,自主研发出了不再依赖Transformer的全新架构—“Yan架构”。同时,基于Yan架构的通用大模型应运而生。
作为国内首个非Attention机制的通用自然语言大模型,Yan架构用线性的自然语言关联特征、关联函数等,解决了Transformer算力消耗、显存占用及成本高昂的缺陷,拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。
Yan架构在保持性能的同时为大模型做了“瘦身”,从而大幅降低部署难度及应用成本,使Yan模型可以在0压缩、0裁剪的前提下,在目前主流的消费级CPU设备、甚至是笔记本电脑中无损运行。
岩芯数智是岩山科技旗下的科技创新型企业,是岩山科技在人工智能领域布局的重要一环。近年来,岩山科技全面拥抱人工智能新浪潮,目前已经在人工智能领域的智能驾驶、类脑智能、AIGC等新兴领域进行了布局,创造先进的人工智能科技产品和服务。
(编辑 张钰鹏)