又一小步,腾讯“高调”进军AI新药研发!


在2020年世界人工智能大会召开前夕,腾讯在自家的公众号上高调宣布了一个消息:进军AI新药研发领域,并且正式对外发布其自主研发的首个AI驱动药物大仙平台“云深智药”。在7月9日的2020世界人工智能大会云端峰会开幕会上,腾讯首席运营官任宇昕确认并公布了这一消息。

任宇昕表示,云深智药平台的推出,将帮助研发人员提升临床前药物发现的效率,有望缓解新冠疫情威胁下,医药行业亟需快速、低成本地进行药物研发的痛点。

据悉云深智药平台整合腾讯 AI Lab和腾讯云在前沿算法、优化数据库以及计算资源上的优势,提供覆盖临床前新药发现流程的五大模块,包括蛋白质结构预测、虚拟筛选、分子设计/优化、ADMET性质预测(即将开源)及合成路线规划。

当年腾讯觅影发布后,马化腾在朋友圈表示“一小步,有希望”。而此次“高调”进入AI新药研发,这预示着除了影像分析、辅助诊断等领域外,腾讯在医疗AI领域的布局再迈进一步。

1、覆盖新药发现全流程

临床前新药发现流程要经历从靶点的发现和验证,苗头化合物的发现,先导化合物的发现和优化直至临床候选化合物的确认及开发。据悉,腾讯的云深智药平台功能模块覆盖从靶点识别和确定到候选化合物确认及开发等整个流程,让研发人员更便捷开展研究。

又一小步1970

以靶点识别和确认为例,大家都知道新药发现是一个复杂的系统工程,第一步是靶点识别和确认,即找到药物在体内的作用位点,而确定靶点蛋白质的结构是其中的关键工作,被视为药物研发的重要基石。比如一个蛋白参与了某个疾病并成为关键通路上的重要一环,那么当研究人员了解该蛋白的结构后,就可以有针对性地设计药物分子来调节蛋白的功能。实验测定蛋白质结构往往难度大、周期长、费用高;通过深度学习模型预测出蛋白质结构以及功能后,计算机便可以更快的从数亿的海量小分子中,快速而有针对性地找到潜在的苗头化合物。

腾讯的云深智药平台采用的蛋白质结构预测方法实现了两项关键技术突破:一是基于自监督学习的蛋白质折叠方法,不依赖同源序列,而是直接从序列数据库中通过自监督学习,学得共进化的模式,从而能够从无到有地产生出含有共进化信息的伪同源序列,并最终让这些蛋白能够有效折叠;二是通过一种基于深度学习的可迭代方法,有效整合模板建模与自由建模,首次提出了动态的、可迭代的氨基酸对特异性的约束条件,显著提高了建模的精度,从而更好的折叠蛋白。

在针对靶点筛选苗头化合物上,云深智药也有一定的优势。

与传统的实验筛选相比,计算方法进行的虚拟筛选无需消耗化合物样品,能极大节省人力物力。基于配体的药物设计方法(ligand-based drug design,LBDD)是虚拟筛选的常见方法之一,即从已知的有活性的配体小分子结构出发,学习和建立分子结构与活性之间关系的模型,用来预测新化合物的活性。由于很多靶点的已测得的化合物活性数据非常有限,严重制约了预测模型的准确性。而云深智药平台的虚拟筛选模块首次将元学习和深度神经网络算法用于LBDD任务,通过AI迁移从其他靶点上面学习到的知识(如分子局部结构对靶点结合强度的影响),应用在目标靶点上来提高模型预测精度。目前该算法在数千个实验数据集上预测精度(预测活性与实验测量活性的相关性)的中位数从目前最高记录0.36提升到0.42,且筛选可用模型的百分比从56%提升到60%,突破业界标准。

2、提供数据库-算法-算力一体化服务

AI赋能药物研发,算法、算力、数据三要素缺一不可、且相辅相成。先进算法对已有大数据深度挖掘并分析数据间的隐含关系。这个过程不仅直接助力新药发现,还整合了大量已有数据库,同时促进新数据的产生和积累,转而更好的优化算法;优化的算法反过来也能降低模型对数据量的依赖,提高模型的范化性;而腾讯强大的算力支持则加快了数据库存储查找、算法迭代速度,并大大缩短使用模型的运算时间。

又一小步1970

数据方面,分子大数据是药物研发中的基础设施。现有的药物分子公开数据集,以PubChem和ChEMBL等为代表,其来源多样。但也由于数据来源于不同机构的不同实验环境,存在数据难以对齐,字段缺失较多,总体质量不佳的问题,从而难以直接用于开发预测模型。云深智药平台使用的分子大数据,基于现有公开数据集,进行了多个环节的精细清洗整理工作,得到可以用于直接构建深度学习模型的药物分子大数据集,并且已在多个药物研发的项目中得到应用验证,清洗过程对多个项目的结果均有很大的提升作用。清洗过后的、打通多个数据库的大数据集已在陆续上线中。

算力方面,腾讯云为云深智药平台提供数据库服务,药企、科研机构登录平台即可开展研究,不需要再自行部署计算资源,从而能快速地将AI能力引入现有的研发流程中。

结语

目前在人工智能新药研发领域主要有三类公司:大型药企、AI技术公司和药物研究机构,它们都在为人工智能在医疗领域的应用进行各种尝试。作为腾讯以AI技术赋能药物发现的首个产品,云深智药平台目前的各个功能模块和分子数据库还处在持续的迭代中,据悉,云深智药已经和多家药企达成合作,并且平台上已经运行了十个左右研发项目,其中包括对抗新冠病毒药物的虚拟筛选和性质预测,筛选得到的化合物目前正在实验验证中。

当然,腾讯跟AI新药研发早有渊源,此前腾讯已经连续投资了国内AI新药研发企业晶泰科技的A轮和B轮。只不过作为一个巨头亲自下场干,整合自己的资源和技术,对推动行业的发展,终归是好事。

除了腾讯,阿里云也在进行AI新药研发的探索,百度李彦宏也表示未来在公共卫生的监测、新药研发和疾病诊断等方面,人工智能大有可为。

云深不知处,AI助力新药研发还处在初期阶段,还需要解决很多的困难和挑战,需要更多的关注和投入,希望未来AI新药研发领域有更多的突破。

综合编辑自腾讯AI实验室、雷锋网等。