摘要药物组合的协同作用可以解决单一药物疗法在治疗复杂疾病中获得耐药性的问题,特别是在癌症治疗领域,药物组合疗法被广泛应用。由于药物组合中的不同成分之间可能存在复杂的相互作用,因此如何快速、准确地预测药物之间的相互作用对于设计有效的药物组合具有至关重要的意义。传统的药物相互作用研究方法需要进行大量的实验室测试和临床试验,成本高、时间长、效率低,尤其是在抗癌药物研发中更加明显。为了解决这个问题,利用机器学习和深度学习等计算方法进行高通量筛选试验成为了一种趋势,因为这些方法可以有效地缩短药物研发周期和降低成本。<br> 对于抗癌药协同作用预测的研究主要是基于传统的机器学习和深度学习方法,在操作上以药物的化学分子表征输入数据,然后经过一个训练好的神经网络模型得到最终的预测结果,这些研究中的创新多来自于预测模型结构的改变和数据的预处理。近年来随着深度学习在NLP领域的成功,以Transformer为代表的预训练模型加下游任务的方案开始在药物化学反应预测、药物化学合成和药物分子优化等领域流行起来。这种方法首先在预训练过程中,可以利用大规模的药物化合物和相关生物医学文献数据集,以学习药物分子的语义表示。在下游任务中,可以将预训练模型与适当的结构(如全连接网络、卷积神经网络或残差神经网络等)相结合,以学习药物之间的相互作用并给出预测结果。有研究者尝试将Transformer模型应用到药物协同作用预测领域,但由于输入数据不是文本形式,所以模型主体部分的Transformer 编解码结构没有使用词向量嵌入和位置编码,使得模型失去了理解药物分子结构与药物组合序列中分子距离特征的能力。<br> 为了解决这一局限性,我们提出了一种新的方法:SMILESynergy。该方法以药物的文本数据简化分子线性输入规范(SMILES)为输入,利用Transformer作为预训练模型,对药物组合的协同作用进行预测。SMILES是一种常用的分子结构表示方法,可以将复杂的化学结构转换成简单的字符串,方便进行数据处理和分析。通过SMILES Enumeration技术,可以对药物组合进行数据增强,从而提高模型的鲁棒性和泛化能力。<br> 在 SMILESynergy 方法中,预训练模型采用包括词向量嵌入和位置编码的Transformer模型对药物数据进行编码。Transformer是一种基于自注意力机制的神经网络模型,具有很强的表达能力和自适应性,适用于处理自然语言处理和序列数据等任务。在预训练过程中,模型通过学习大量的未标注数据,提取药物分子中的潜在特征,从而达到更好的效果。在下游任务中,将预训练模型与多层感知器(Multilayer Perceptron,MLP)相连,对药物组合的协同作用进行回归和分类任务的预测。<br> 通过对O''Neil和NCI-ALMANAC 数据集的实验验证, SMILESynergy模型在回归分析中的均方误差为51.3,在分类分析中准确率为96.9%。其准确率高于其他常见的药物组合预测模型,例如 DeepSynergy、MulinputSynergy 等模型。这表明SMILESynergy方法具有较好的实用性和适用性,能为药物组合研究和抗癌药物研发提供了新的思路和方法。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文