摘要药物发现和药物重定向是一项花销很高并且很耗时的进程,而推进药物发现和药物重定向进程发展的一个有效的方法是从分子层面上对药物和靶标的相互作用关系进行预测。传统的方法对药物和靶标的相互作用关系进行预测存在特征难以获取以及计算复杂度高等问题。因此,近年来,许多统计学习方法被用来解决药物靶标相互作用关系预测问题,尽管他们在预测上很有效,但是它们仍存在以下问题:首先是缺少负样本的问题,在现在所有的记录药物靶标相互作用关系的数据库中,均只有已经经过实验验证的药物靶标相互作用关系数据,而经过实验验证的药物靶标之间不存在相互作用的数据在任何数据库中都没有记录。其次是药物靶标的特征选取以及表示问题,主要是考虑如何选择合适的特征以贴合的表达一个药物一个靶标,怎样组合药物特征和靶标特征才能完整表达一个药物靶标对。为了解决上述的两个问题,本文做了如下工作。<br> 1)在药物靶标对特征构建的过程中,本文针对药物结构特征矩阵和靶标结构特征矩阵它们内部存在相互依赖的问题,提出了一种适用于0-1矩阵的信息增益主成分分析法(Information Gain Principal Component Analysis,IGPCA),并提出了三种基于药物靶标相互关系矩阵构建网络特征的方法。最后,本文采用五折交叉验证法对该方法进行了有效性验证,实验结果表明,使用IGPCA处理后的结构特征在各种分类器下能取得很好的效果,网络特征在大部分分类器下是有效的。<br> 2)为了解决负样本缺失以及特征表达的问题,本文提出了二维逻辑回归模型(Two Dimensional Logistic Regression Model,TwoDLLR)用于药物靶标相互作用关系的预测。该模型将二维计算模型引入逻辑回归方程,并利用Pearson相关系数和随机梯度下降法求解模型参数。模型能够很好的适应药物靶标关系预测问题的药物特征和靶标特征分开的情况,并且该模型能够不使用负样本,解决了药物靶标相互作用关系预测问题中的不存在负样本的问题。五折交叉验证的实验结果表明,本文提出的模型在AUC、Accuracy和F-score指标下都能取得很好的效果,并且TwoDLLR模型能够预测新药物的相互作用靶标以及预测新靶标的相互作用药物。
更多相关知识
- 浏览0
- 被引3
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文