海天瑞声:公司针对大模型预训练数据集设计与处理技术进行了初步研究和规划

http://ddx.gubit.cn  2023-09-11 12:25  海天瑞声(688787)公司分析

转自:证券时报·e公司

e公司讯,海天瑞声近日在机构调研时表示,公司正在积极推进数据生产垂直大模型的建设工作。截至目前,公司针对大模型预训练数据集设计与处理技术进行了初步研究和规划,并基于研究成果开展了CommonCrawl、中文书籍等适用于预训练阶段的数据的获取与清洗工作,形成了各项技术的框架方向;同时,开展大模型评测技术调研,完成基础框架设计,形成可行性结论。未来,公司会基于实际市场需求,在大模型基础技术研究、大模型算法研发以及平台工具建设等方面,持续推进数据生产垂直大模型的建设。