国内首个校对垂直领域大模型“蜜度文修”重磅发布 科大讯飞与蜜度进行合作签约
本报记者 袁传玺
由垂直领域头部企业主办的各类论坛已成为每届世界人工智能大会(WAIC)的重要组成部分,7月7日,在WAIC开幕的第二天,由语言智能科技企业蜜度主办的“语言智能与内容生成高峰论坛”,在上海浦东世博展览馆拉开帷幕。论坛现场,蜜度发布了自研的国内首个专为智能校对领域打造的垂直大语言模型——蜜度文修。
蜜度文修重磅发布
特定任务表现优于通用大模型ChatGPT
在语言智能与内容生成高峰论坛上,蜜度文修正式发布。唐宋八大家之一的欧阳修曾任馆阁校勘,校对亦有修文之意,“蜜度文修”便取名于此。蜜度文修专为校对这一垂直专业领域打造,在中文拼写勘误、语法纠正任务上的表现显著优于通用大模型ChatGPT。
蜜度文修以大语言模型(LLM)为技术底座,通过运用高质量数据学习多种特色子任务,大幅度提升中文校对和润色能力的智能化程度。截至目前,在公开测试语料评测结果中,蜜度文修实现各类校对项目F1值(模型精确率与召回率的调和平均数,用以阐述模型完成指定任务的质量)的全面SOTA(state-of-the-art,指模型在指定任务中的表现为当前业界最优)。蜜度文修以卓越的实力,不仅辅助专业用户提高校对质量、提升校对速度、降低差错率,也为新闻出版、媒体稿件、政务公文等专业领域带来革命性的工作模式迭代与效率提升,为新时代语言文字工作高质量发展注智赋能。
其实,早在2020年,蜜度就推出了智能文本检测服务,并以深度学习模型为方向,尝试智能化地解决基础校对问题。蜜度还成立了多语言校对检测实验室,围绕“文字标点差错”、“知识性差错”、“内容导向风险识别”三个主要能力开展建设。在2022年的WAIC上,蜜度发布了支持本地化部署的蜜度校对通AI-Box,而这也是首个通过华为昇腾AI生态认证的自然语言处理智能文本校对应用解决方案。2023年初,蜜度智能校对系统成功地入选国家新闻出版署2022年出版业科技与示范创新项目“科技创新成果”。
今年4月,蜜度智能校对多语言版正式上线,除了汉字、英文之外,还覆盖了蒙古文、藏文、维吾尔文、朝鲜文、壮文、哈萨克文、傣文、乌孜别克文、柯尔克孜文、俄罗斯文、彝文、傈僳文共计12种少数民族语言文字。6月,蜜度正式推出中文润色服务,重点解决用词不当、句式杂糅等措辞与表述问题。
一个月后,在2023年的WAIC现场,蜜度推出全新的蜜度文修,让大模型时代的全新工作范式走入校对场景,除了刷新多类校对任务的最佳效果之外,完善了过去较为薄弱的易混词细微语义辨析难题,同时在尊重原意表达的基础上,更好地修正句式杂糅、逻辑错乱等问题,使句子表达更流畅,实现对句子的润色功能。蜜度文修的发布,可以视为蜜度在大模型时代,采用与时俱进的前沿科技积极赋能垂直办公场景的一次实践。
论坛现场还举行了科大讯飞与蜜度的合作签约仪式,科大讯飞开放平台总经理张斌与蜜度首席执行官翟光景签署合作协议。未来,双方将深化各自技术优势,携手推进智能校对产业的进阶,共同赋能行业生态,为更多企业及机构提供高质量的智能化校对服务。
语言智能与内容生成高峰论坛:未来更可期
除了蜜度文修大模型的重磅发布之外,论坛现场汇集了行业洞见思考及先驱科研讨论。论坛由哈尔滨工业大学计算学部长聘教授、人工智能研究院副院长车万翔主持,微博COO、新浪移动CEO、新浪AI媒体研究院院长王巍致辞。
随后,业内重量级专家学者进行了主旨演讲。硅谷人工智能研究院(SVAIRI)创始人、《硅谷百年史》与《人类2.0》的作者皮埃罗·斯加鲁菲带来在《Transformer模型——新型内容生成计算机架构》的主旨演讲。国务院国有资产监督管理委员会新闻中心副主任、《国资报告》杂志社总编辑闫永则以《AIGC时代全媒体传播内容的供给侧改革》为题进行主题分享;国家语委中国语言智能研究中心主任、中国人工智能学会语言智能专委会主任周建设分享了语言智能与智性工具革命间的内容;哈尔滨工业大学计算学部教授、自然语言处理研究所副所长秦兵则发表了题为《大语言模型之安全性检测及人类价值观对齐》的主旨演讲,关注人工智能发展征程中绕不开的安全与伦理议题;中国人民大学信息资源管理学院副教授夏天以《智能校对领域大语言模型的探索与实践》为题,回顾了校对场景下AI能力的几次里程碑式跃升,也对大模型时代的智能校对产品提出了新的希冀。
蜜度于WAIC盛会期间主办语言智能与内容生成高峰论坛,交流分享语言智能与内容生成领域的技术创新与应用实践,用创新助推大模型的演进,持续以优秀的模型能力,解决真实场景中的用户需求,为数字政府、数字营销、数字媒体、数字城市的建设提供全方位的智能应用解决方案,深度赋能政府与企业办公场景的数字化、智能化转型升级,为千行百业的革新发展提供动力。
(编辑 李波)