摘要在人类与疾病的长期斗争中,特别是近年来新型冠状病毒感染在全球范围内大流行,药物发挥着越来越重要的作用。新药物的研发存在投入成本高,耗费时间长的问题。传统药物发现过程的主要挑战是化学分子的搜索空间巨大且离散,高通量筛选以及虚拟筛选的方法需要耗费大量计算资源。随着深度学习的广泛应用,大量研究者们尝试将深度学习技术引入到分子生成领域,结合深度神经网络的从头分子设计已成为新药研发的重要途径。然而,其中仍然面临许多挑战。例如,药物分子在生成过程中,通常被转化为稀疏的独热编码形式,忽略了原子之间的相互作用。此外,药物分子的序列结构远比普通小分子更复杂,分子生成的过程需要模型具有更长时间的语义学习能力。针对以上面临的两个问题,本论文基于深度学习技术,创建了两种药物分子的生成模型,从不同的角度解决分子生成过程的问题,开发高效生成工具。本文的主要工作如下:<br> 1、基于生成对抗网络的分子图生成模型。针对生成对抗网络模型实现“单次”分子图生成会出现模型崩溃的问题,我们首先使用正则化方法来约束数据在环境空间中的梯度,缓解训练梯度的消失。其次,提出了一种新的惩罚策略来规范鉴别器,维持“生成”和“鉴别”的博弈平衡。最后,添加Y-网络获得并行的输入变量,防止单调值的生成。为了证明提出方法的有效性,收集了相应的小分子数据进行实验验证。同时,引入迁移学习机制,生成具有理想药理性质的多巴胺受体活性分子。<br> 2、利用循环神经网络生成药物分子文库。为进一步提升模型提取药物分子的语义结构能力,我们提出了一种基于嵌套循环神经网络的分子生成模型。该模型摒弃传统堆叠式的方法,引入嵌套长短时记忆神经网络,采用序列编码进一步加强生成分子的元素分布和化学键之间的平衡。进一步地,利用上述提出的方法,生成与SARS-CoV-2主蛋白酶抑制剂具有相似化学结构的药物分子,并基于机器学习模型构建活性药物分子文库。分子对接实验表明,模型生成的药物分子有可能成为SARS-CoV-2主蛋白酶抑制剂。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文