“像自动驾驶一样训练智能体完成蛋白进化” 华大智造研发团队Nature子刊成果发布

http://ddx.gubit.cn 2023-07-21 15:49 华大智造(688114)公司分析

在华大智造(688114)研发团队的努力下，蛋白质设计有望成为人工智能“攻克”的又一领域。

7月20日，国际顶级学术期刊Nature子刊在线发表了华大智造杨梦团队研究成果《Self-play reinforcement learning guides protein engineering》，发布了一款名为EvoPlay的算法模型。这是华大智造团队在该杂志发表单细胞对比学习自监督Concerto算法后，时隔一年再度发表AI算法相关文章。

“EvoPlay算法模型就是借鉴围棋自博弈的方式搜索海量蛋白质突变空间，通过结合不同的功能或结构预测模拟器，像自动驾驶一样训练智能体完成指定功能增强的蛋白进化，”华大智造方面向记者介绍，“其实，从名字就可以看出，EvoPlay由Evo、Play两个英文单词组合而成，前者意为进化，指蛋白质分子的功能进化，后者指的是博弈类搜索算法。”

在ChatGPT引爆舆论之前，人工智能领域上一轮引发高度关注的关键词就是“博弈”。2016年，AlphaGo与世界围棋冠军李世石进行五局三胜的对弈，并以4比1的总比分获胜，引起了广泛的关注和震动。

本次华大智造发布的EvoPlay模型，便是借鉴了AlphaGo后续进化版本AlphaZero模型的思路，将其运用到了蛋白质设计领域当中。

华大智造介绍，研究团队将蛋白质序列上每一个位点的突变当作是围棋中的每一次落子，将优化的最终序列当作是一局围棋的结束，通过自我对弈和蒙特卡洛树搜索在蛋白质序列空间中不断的搜索和优化序列，同时作者使用一个代理模型来为每一次位点突变进行奖励，最终成功生成了大量的具有特定功能的序列。

华大智造专注于基因测序仪及实验室自动化业务，而基因测序仪的迭代升级离不开蛋白工程技术的突破。据记者了解，从华大智造测序仪试剂里用到的聚合酶、荧光素酶等各种工具酶，到更广范围的生物催化剂、生物传感器、治疗类抗体到生物燃料，都离不开对蛋白质的设计和改造。

文章的通讯作者，来自华大智造研发团队的杨梦表示：“我们有理由相信在更多的理性机制分析以及更精密的结构代理模型的帮助下，EvoPlay的蒙特卡洛树搜索+神经网络可以更好地结合‘从头设计’框架，从而为蛋白设计领域提供新的思路，也可以用来进一步优化基因测序仪里用到的各种工具酶。”

目前，EvoPlay模型已经进行了一些实践，并且取得了一定成果。研究者已经利用EvoPlay前瞻性地设计了36个荧光素酶突变体，其中的29个变体已申请专利。EvoPlay在寻找起始库之外更高适应性突变体方面也非常有效，并且可以与现有的工程流程相集成。同时，实践也证实了EvoPlay展示了其在高效设计高质量多肽上的性能，将适用于蛋白质-蛋白质相互作用、酶设计和药物发现等多种应用领域。

EvoPlay模型的推出，印证了在生命科学领域即将有越来越多自动驾驶实验室出现的大趋势。

华大智造方面展望称，未来在生命科学和技术实验室中的各个环节，包括实验的执行、数据的收集和分析、实验计划的制定等，都可以由自动化系统和人工智能来完成。并且智能体还可以通过LLM等工具整合外部知识，多轮迭代探索，连续学习，创造出满足人类需求的酶、抗体、小分子、基因序列甚至人造细胞。