“神仙打架”的国奖背后 科大讯飞突围
6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。发布会上,科大讯飞董事长刘庆峰高兴地宣布,科大讯飞刚刚获得国家科学技术进步奖一等奖,并称这是“十年磨一剑”的结果。
此届“国奖”堪称史上竞争最为激烈的一年,项目评审堪称“神仙打架”。但仍有一批高校院所和科技企业脱颖而出,扛起了“国奖”的第一把交椅。
“国奖”竞争激烈,折射的是中国科技实力的日益强大。更为欣喜的是,相较于往年大多“国奖”的牵头者为清华大学、中国科学院等高校院所,今年,在获奖名单中,笔者更多看到了科大讯飞、比亚迪、海尔等企业作为第一完成单位摘获“国奖”。
可见,坚持攻击关键核心技术的生动实践,在中国企业身上得到了诠释。
最激烈的一年“国奖”
竞争最激烈、审核最严格,参报项目“神仙打架”、提名评审“地狱模式”——因政策调整及其他原因,国家科学技术奖历经两年的沉淀和积累,仅国家科学技术进步奖这一类别,提名阶段就有700多个项目角逐。
为何今年国家科学技术奖的奖项竞争如此“白热化”?因为想获奖,难的不仅是优秀成果数量庞大、提名和评审标准更加严格,更因科技奖励制度改革的深化。
2021年、2022年,国家科学技术奖暂停申报,各领域积累了大量具有突破性和创新性的科研成果,使得2023年度国家科技奖的提名环节指标难以获得,初评环节的网评也变得更加严格。
加上修改后的《国家科学技术奖励条例》,强调科技奖励工作坚持国家战略导向,并与国家重大战略需求和中长期科技发展规划紧密结合。这一改革举措使得2023年的评奖工作更加注重项目的战略性和创造性贡献,评奖标准的提高,让“国奖”再上一层难度。
本着“宁缺毋滥”的原则,2023年度的评奖工作着重优化了评审组设置和评审委员会的专家构成,强化了对重点领域的关注。《国家科学技术奖提名办法》的制定,也压实了提名者对材料把关的责任,加强了对候选者的审核和诚信审核,这些措施确保了提名和评审过程的严谨性和公正性,但也提升了通过的难度。
层层积累效应加剧了竞争的激烈。但更为重要的是,这也体现了我国科技领域的快速发展和创新能力的提升,也预示着未来我国科技事业将更加充满活力和竞争力。
揭秘获奖背后
竞争虽然激烈,但值得欣喜的是,相较于往年大多“国奖”的牵头者为清华大学、中国科学院等高校院所,今年,在获奖名单中,笔者更多看到了市场主体的身影——科大讯飞、比亚迪、海尔等企业,作为第一完成单位摘获“国奖”。
其中,科大讯飞牵头的“多语种智能语音关键技术及产业化”项目摘获国家科学技术进步奖一等奖,是19项国家科学技术进步奖特等奖、一等奖中唯一作为牵头单位获奖的民营企业。
这也让科大讯飞立即成为焦点所在——该类别奖项只给予提高行业整体技术水平、竞争能力和系统创新能力,或者开拓新的经济增长点和新兴产业的项目。此次获奖,也是深度学习引发新一代人工智能浪潮以来,过去十年人工智能领域首个国家科学技术进步奖一等奖。
这匹“黑马”凭何实力脱颖而出?先来搞懂获奖的技术“硬”在哪里。
作为“多语种智能语音关键技术及产业化”项目的第一完成单位,科大讯飞AI研究院副院长高建清表示,该项目包含多语种语音识别、多语种语音合成、多语种翻译技术等为一体的综合技术,除了支持6个联合国通用语种,还包括挪威语、丹麦语等小语种63个。同时,该项目还覆盖了维、藏、蒙、哈、朝、壮、彝等24种少数民族语言和中国方言,未来还将覆盖更多方言。
简而言之,科大讯飞打造出了一个“超级翻译师”。
语音是人类最自然便捷的沟通方式,也是智能设备人机交互的关键入口。其实早在2002年和2011年,科大讯飞就分别获得过国家科学技术进步奖二等奖。此次拨得头筹,并非一蹴而就,而是源于20余年的技术攻坚。
“在这个项目中,我们在关键技术上主要取得了四大突破,达到国际领先水平。”高建清解释,在复杂语音信号解耦建模、多语种共享建模、语音语义联合建模、国产异构硬件平台训练及推理加速等四大关键技术方面,由科大讯飞牵头的“合肥技术”均取得了巨大突破。
例如在语音识别研究中,最具挑战的是远场、噪声、多人语音混叠等现象,对此,科大讯飞提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,使得复杂场景下语音识别准确率得到重大突破。
在这些技术的支撑下,科大讯飞连续 4 届获得国际多通道语音分离和识别比赛 CHIME 冠军;连续 8 届获得国际语音合成大赛 Blizzard Challenge 冠军。2015年,相关技术首次在大会演讲场景实现语音转写超过人类速记员水平;2019年起连续六年服务全国相关重要会议。
又如在复杂应用场景下,语音交互、语音翻译面临着深层次语义理解困难、专业性不足等问题。对此,科大讯飞提出语音语义互增强的鲁棒口语理解技术和多源知识增强的可信文本生成技术。这一技术在英语口语评测已经应用,首次达到人类专家水平,是唯一满足高考应用要求的技术,累计服务超1.3亿考生。
而且,为了突破芯片“卡脖子”难题,科大讯飞选择攻坚国产异构硬件平台训练,打造出可以“百搭”千行百业的国产化平台,解决智能语音技术硬件平台的关键问题。
目前,科大讯飞已建成5个国产化集群,语音合成、识别、翻译、交互等国产化能力日服务8.73亿次。2023年,科大讯飞与华为联合攻关大模型国产化算力底座核心难题,建设首个万卡全国产算力平台“飞星一号”,填补了国产超大模型训练平台的空白。
三年实现直接经济效益超500亿
相较于国家技术发明奖等奖项,国家科学技术进步奖的评审有一个非常重要的维度,就是产业化。多语种智能语音关键技术持续突破,如何实现产业化?
目前,科大讯飞围绕多语种智能语音技术构建了自主可控的产业生态,开创引领了我国语音产业的产业链,助力中国制造出海;助力民族团结,促进全球语言互通和“一带一路”建设;并且在进一步打造覆盖全球的国际产业生态。
比如由该项目衍生出的车载智能化产品,目前已累计前装超 5300万套,支持奇瑞、一汽、长安等车企超200万套订单出海。科大讯飞2017年开始承建的智能语音国家新一代人工智能开放创新平台,已聚集平台开发者数700.7万,终端设备数40.5亿,海外开发者数超过40万,构建出自主可控的多语种智能语音技术及全球产业生态。
技术升级,带来产业生态生生不息。近三年来,“多语种智能语音关键技术及产业化”项目累计实现直接经济效益 521.28 亿元,并带动由工信部门和安徽省共建、以科大讯飞为核心的“中国声谷”产业集聚发展,上升为中部崛起的“国家战略”。
而多语种语音技术与大模型的结合,正加速万物互联时代的到来。6月27日,在讯飞星火V4.0的发布会上,星火语音大模型再突破,发布74个语种/方言免切换对话,破解强干扰场景下语音识别难题,发布极复杂场景语音转写技术,并通过云边端及软硬一体化解决方案,赋能汽车、家电、机器人等领域人机交互变革。