摘要近几十年里,药物分子设计拥有了突飞猛进的发展。新的药物的开发起始于当人们针对某个疾病的重要靶标设法找到新的药物或者更有药效的药物。如果只用实验来检测大量的小分子与靶标的相互作用则是一件非常消耗时间和资源的事。于是,人们设法用一些技巧来给予药物分子设计一些指导。这样可以减小需要用实验来检测的范围,以便于更经济的找到治疗疾病的药物小分子。药物分子设计经常涉及到的一个事宜就是测药物小分子针对某个靶标的活性。活性高则有可能视为一个有潜能进一步发展的药物,而活性低则可能被视为一个不跟靶标作用而且不可行的药物分子设计。这种筛选出高活性的药物分子,淘汰低活性药物分子的过程极大的减少了下一步实验上需要检测的药物分子数量。在计算机和科技的迅速发展下,人们可以用计算机来计算某个虚构的药物小分子与靶标的活性。这种用计算机来计算药物分子与靶标间的活性的方法成为了一种预测新构建的药物小分子与靶标的活性的重要手段。那些活性被预测得比较高的药物小分子设计则可以进一步在实验中检测。<br> 自从Hansch和Fujita提出了定量构效关系(Quantitative Structure ActivityRelationship)以来,用QSAR发的科技文章不计其数。Hansch和Fujita最初提出的定量构效关系是二维的,为接下来开发的各种QSAR的延伸和演变铺下了牢固的基础。Hansch和Fujita的方法最初的大体思路是在有机小分子的重要基团上进行修饰和替换之后来预测新构建的分子的活性。用物化的参数和方程可以达到这种预测。比如,当在关键位点替换电性基团,疏水基团,或者增强立体相互作用的基团后,新构建的分子的活性都可以以定量构效方程来预测。<br> 当科技和图形软件发展到一定的程度时,人们发展了三维的定量构效关系,也就是学术期刊里常见的3D-QSAR。之前,研究小分子和靶标的相互作用机制时只能用二维的模型。但是实际上,蛋白大分子和药物小分子的相互作用是立体的,前后左右四面八方都要考虑。分子本身就是一个立体的形状。3D-QSAR为了研究小分子和靶标的立体相互作用铺垫了良好的基础。在研究开发治疗疾病的药物小分子的不断需求中,由于药物分子设计的复杂性,科学家创造了更多的以3D-QSAR为基础的演变和延伸来迎合在药物分子设计和开发中的不同需求。<br> 3D-QSAR的基本理念是通过计算分子场来达到以自变量为分子活性,因变量为分子场计算出来的各种物理化学性质参数的线性回归。分子场的计算是通过在小分子和大分子的相互作用区域中插入探针原子以及在探针原子的每个位点分别计算出的分子场的结合所得。3D-QSAR的一个重要的假设是通过能量优化过后的以小分子和靶标结合的复合物可以足够准确的代表这个活性构象。其次,分子场的计算也必须是在优化过后才进行的。在3D-QSAR研究中,确定研究体系中一系列小分子的活性构象是必须的,而小分子活性构象的重叠是3D-QSAR研究的重要一步,其研究的目的是以活性和结构的线性回归来了解小分子的构象与活性的关系。而通过了解这种关系,可以辅助科学家设计针对不同靶标所需求的新药物小分子。通过替换关键基团,科学家希望通过这种定量构效关系可以获得更有药效,更具选择性的药物。选择性的提高一方面也是为了药物能更精准的靶向目标靶标,同时又不轻易的和其他的非目标靶标作用,尤其是对有关人体本身的正常功能的靶标进行具有危害的相互作用。<br> 3D-QSAR最典型的两种方法是比较分子场分析方法(CoMFA)和比较分子相似性指数分析方法(CoMSIA)。CoMFA的中心思想是:一个目标特征的值跟它的非共价分子场的形状密切相关。把分子场的数据信息放进QSAR表格里需要在定区间内计算立体场(Lennard-Jones)和静电场(Coulombic)的场值。CoMFA的另外一个重要特点是小分子的骨架必须足够相似,使它们在重叠后具有可比较的分子场。此后,偏最小二乘法分析将被运行以得到最终的QSAR模型。定量构效关系被建立后,这个目标特征在新设计的小分子结构里可以被预测。CoMSIA与CoMFA稍有些不同,但是基本理念一致。其明显的不同点在于除了计算立体和静电分子场还可以计算疏水、氢键受体、和氢键给体的分子场。<br> 我们的课题组开拓了一种3D-QSAR的演变方法,其方法被命名为Mutation-dependent Biomacromolecular Quantitative Structure Activity Relationship(MB-QSAR)。MB-QSAR的最重要的突破点在于其以大分子为变量来研究同一个小分子对若干个大分子的活性。通过计算分子场,此方法可以找出在大分子活性空腔周围的哪些区域拥有蛋白残基和小分子的哪种特别的相互作用有利于活性的提升。之前3D-QSAR是通过利用小分子为变量来研究多个小分子对同一个蛋白的活性。但是,3D-QSAR无法达到研究小分子药物对多个蛋白的抗性和选择性的这个科学问题。于是,MB-QSAR的价值在此得到了发挥。MB-QSAR不但可以帮助科学家了解蛋白对小分子的抗性和小分子对多个蛋白的选择性机制,而且通过以大分子为变量的定量构效关系可以反过来指导新的药物分子设计。<br> 目前,MB-QSAR主要运用于小分子对多个大分子的选择性和抗性的研究。在我们研究的体系里,小分子靶向的靶标蛋白里有多个突变体。靶标酶由于药物的广泛使用,经常会经过突变对药物产生抗性。通过研究这种抗性产生的分子机制则可以辅助科学家研究和开发出规避靶标抗性的药物小分子。当然,靶标会不停发生突变。通过此突变会对新的药物又产生抗性。所以,研究和开发出一种能精确的帮助科学家了解和规避这种抗性对药物产生的失效是人类战胜病患的一项重要的工程。顾名思义,MB-QSAR可以对蛋白突变体针对不同的小分子的抗性进行预测和研究。除了抗性以外,药物对靶标的选择性也很重要。选择性的重要性有两个方面。一是通过精准的靶向病毒蛋白以避开靶向那些和人体重要功能相关的蛋白可以降低药物的毒性。二是通过高选择性的靶向目标蛋白可以提高药物的药效。目前MB-QSAR方法已经在HIV蛋白酶、乙酰羟基酸合成酶对药物的抗性预测中得到应用,同时也对激酶体系药物的选择性开展了预测研究。<br> HIV蛋白酶是HIV病毒里的一个关键的酶。抑制此酶将使HIV蛋白失去感染能力。现在抑制HIV蛋白酶的药物已经起码有9种上市了。不过,HIV蛋白的多样突变对这些上市的药物产生了严重的抗性。在我们组的研究当中,我们利用文献里的HIV蛋白针对药物小分子的抗性数据建立了预测HIV蛋白酶突变体抗性的MB-QSAR模型。我们对奎那韦、利托那韦、茚地那韦、安普那韦、奈非那韦和洛匹那韦这六种药物对HIV蛋白的抗性进行了良好的预测。我们建立的模型对设计具有抗性规避能力的新药物小分子可以提供一些指导。<br> 乙酰羟基酸合成酶是绿色除草剂的一个重要作用靶标。以乙酰羟基酸合成酶为靶标的除草剂对杂草的广泛使用使杂草对这些除草剂产生了很大的抗性。在课题组的前期工作里,我们构建了106种乙酰羟基酸合成酶的单点和双点突变并测定了这些突变体的表观抑制常数值。我们并且利用了这些数据来构建针对4种除草剂分子嘧磺隆、氯磺隆、阔草清和双草醚对乙酰羟基酸合成酶的抗性进行了良好的预测,并详细的研究了这些除草剂与乙酰羟基合成酶的立体构效关系,可以指导能更好的规避杂草对乙酰基羟基合成酶抑制剂产生的抗性的新抑制剂。<br> 本论文的研究工作主要集中在上市激酶类药物选择性的研究上。蛋白激酶家族是生命体系中最大的蛋白家族之一。蛋白激酶催化丝氨酸、苏氨酸、酪氨酸的磷酸化过程,调控着细胞中主要的信号传导途径,在细胞的生长、代谢、分化和凋亡过程中扮演着极其重要的角色。蛋白激酶功能的失常会引起一系列疾病如癌症、糖尿病、炎症等的发生。发展以蛋白激酶为靶标的高效小分子药物,精确调控蛋白激酶的功能,是治愈这些疾病的途径之一。据报道,目前以蛋白激酶为靶标的药物开发项目占到了所有药物开发项目的接近三分之一。值得注意的是,在以蛋白激酶为靶标的药物开发过程中,由于激酶家族蛋白数目非常多(超过500个),且结构保守性,药物的选择性成为影响药物发挥疗效和阻碍药物成功上市的关键。所以,在进行激酶药物的开发中,预测设计化合物的选择性,并且提供有效的选择性优化指导,是非常关键并且具有挑战性的一步。这是我们研究蛋白激酶的原因。我们希望通过研究多种蛋白激酶跟已经上市的小分子药物的相互作用来辅助新的具有对蛋白激酶选择性高的药物小分子的设计。虽然蛋白激酶核心区域结构的大体相同对于发展高选择性小分子药物是一个障碍,但是对于运用MB-QSAR方法来研究药物的选择性是非常有利的。QSAR研究中遇到的一个很重要的要求是需要所研究的大分子结构务必拥有相似的骨架,而蛋白激酶结构的强烈相似度则符合这一要求。<br> Davis等人2011年在Nature Biotechnology发表的工作测定了72个抑制剂对442种激酶的活性数据,这是目前激酶覆盖面最广的激酶与小分子结合活性数据。我们对文献里面的激酶进行了筛选。在442个激酶里,我们只用了人的激酶,病原体和脂类激酶被排除。另外,非典型激酶、拥有近膜结构域突变的激酶、非磷酸化激酶和伪激酶结构域也被排除在我们的研究体系之外。在文献里使用的442个激酶里,剔除了那些我们认为类别不合适的激酶以后,剩余的392个激酶序列被视为我们要研究的蛋白激酶。<br> 我们在选择激酶抑制剂(药物)时也是以Davis及同事的工作为标准。在他们的工作中,他们将测定的72个抑制剂进行了分类,其中37个认定为I类抑制剂。I类抑制剂研究的最多,它们的结合位点正是ATP的结合位点,是ATP的竞争型抑制剂。在这37个抑制剂中,截止2012年,共有8个商品化药物,包括吉非替尼(gefitinib)、厄洛替尼(erlotinib)、达沙替尼(dasatinib)、博舒替尼(bosutinib)、舒尼替尼(sunitinib)、凡德他尼(vandetanib)、帕唑帕尼(pazopanib)、鲁索替尼(ruxolitinib)。本论文研究的药物有星形孢菌素,舒尼替尼,达沙替尼,博舒替尼,吉非替尼,和凡德他尼。有些药物虽然文献里有报道,也复合我们的I类抑制剂标准,但是它们的复合物晶体结构没有被报道过,因此无法提供给我们复合物结构的参照依据。所以没有包含在我们的研究体系中。<br> 由于大部分的蛋白激酶虽然已知序列但是没有晶体结构,所以我们采取了以同源模建的方式来构建没有晶体结构的蛋白激酶。同源模建的基本理念是相似的序列具有相似的结构,序列相似度越大的蛋白结构越相似。通过寻找序列相似度足够大并且已解析的激酶结构为模板来构建结构未知的蛋白激酶序列。首先做的是在NCBI网上下载了所有的蛋白激酶的序列。再采用了ClusterW2序列比对工具来对所有的蛋白激酶进行序列比对。随后把序列提交到SWISS-MODEL服务器上进行同源模建工作。挑选模板时的一个条件是序列相似度必须在百分之三十以上。在作为模板的蛋白激酶跟所希望构建的激酶的序列比对中所获得的视为相同位点的残基处则把模板中的坐标拷贝到目标序列中的对应残基上。在序列比对中,目标序列中的那些没有在模板上相对应的残基则需要用同源模建构建软件或服务器以特殊的方式来构建那些区域的构象。<br> 在前期工作中,本课题组利用文献中已经报道的实验数据,利用MB-QSAR方法来对星形包菌素、苏尼替尼和达沙替尼分子的选择性的预测研究做了一个初步的尝试。最初的同源模建工作中,分别采取了两种方法:1)使用多模板来构建蛋白激酶的方法。但是,在随后的工作中没有更细致的考虑小分子药物与蛋白激酶的结合问题;2)单模板复合物结构来构建蛋白激酶的方法。不过,在运用单模板模建所有的蛋白激酶的过程中发现了一个问题:蛋白激酶的同源模建结构过于相似。此次研究采取了多模板方式来模建蛋白激酶和小分子药物对接的方法来确定蛋白激酶与小分子药物结合构象的方法。多模板解决了蛋白激酶过于相似的问题。对接的目的是为了能针对某个药物筛选出在复合物里与小分子相互作用的激酶的活性构象。我们考虑了序列的相似性,也考虑了用已报道的复合物作为依据。本论文中,解决一些旧有的问题和对研究的数据数量有明显的提高。<br> 通过使用更新的SWISS-MODEL服务器版本的Automatic Mode,先把蛋白激酶序列拷贝到网上的服务器窗口里,然后让服务器找到那些它认为最合理的模板。通过人为筛选,最终在服务器找到的模板里找到活性构象以及与目标序列同源性大于百分之30的模板来定下最后用的模板,然后用此模板构建出来蛋白激酶结构模型。最后,在确定的392个序列里,有385个序列被成功的模建出来。没能模模建出来的那7个序列是由于找不到同源性足够相似并且处于活性构象的模板。<br> 接下来,本次工作做的是分子对接。为了准备做分子对接则对385个蛋白激酶结构和药物小分子星形孢菌素,舒尼替尼,达沙替尼,博舒替尼,吉非替尼,和凡德他尼进行了适当的处理。大分子先是做了侧链优化。将同源模建得到的结构对侧链进行了优化,以释放蛋白本身的张力,优化使用AMBER力场,AMBER7_FF99电荷。小分子的处理包括加氢、加电荷、以及为了使键角更合理运行的小轮数优化。大分子及小分子的优化都是在SYBYL7.3程序中完成的。接下来是把小分子对接到优化过侧链的大分子中。分子对接采用AutoDock4.2软件进行,分子对接所采用的格子大小为46×46×46(A)3,格子的步长为0.375(A),格子的中心与结合空腔的中心近似重合。对接轮数为200轮。对接过后,则以模板的构象为依据找出了能够跟模板的结合方式匹配的对接构象结果。再把此结果叠合到相应的蛋白激酶以及将此复合物进行复合物优化。复合物优化包括先优化氢键,优化活性空腔,最后放开所有限制,全面优化蛋白小分子复合物。优化活性空腔用到SYBYL软件下的COMPUTE模块,采用MINIMIZE SUBSET的方式进行。采取的具体步骤是:定义小分子药物周围6(A)距离内的氨基酸残基为“Hotregion residues”,对距离小分子药物距离为6~12(A)之内的氨基酸残基定义为“Interesting region residues”。对于“Hot region residues”的残基不加任何限制,进行全优化。对“Interesting region residues”的残基固定它们的位置,但计算它们与“Hot region residues”的相互作用,也就是考虑了它们的影响。离小分子药物12(A)距离外的氨基酸残基,优化过程不考虑。优化采用的方法为Powell收敛算法,能量收敛值为0.01 kcal/mol/(A)。优化完毕之后,我们则把小分子删除,对经过了复合物优化的大分子建立定量构效关系。<br> 在构建QSAR模型时,需要划分训练集和测试集。训练集用来建立MB-QSAR模型;测试集来验证所建立模型的预测准确性。测试集是在模型建立过程中没有考虑的蛋白激酶。只有在训练集上建立的模型对测试集中的分子也具有较好的预测能力时,才认为建立的QSAR模型具有一定的预测能力。划分训练集和测试集的基本原则是训练集和测试集中蛋白激酶类型的均衡。另外,在划分训练集与测试集时还应该考虑两集中的活性数据分布,训练集和测试集应该具有相同或类似的活性分布。<br> 接下来是计算一系列蛋白激酶大分子结合空腔的分子力场值。就是在我们选定的三维空间中放入探针原子,计算这个格子空间中分子场的数值。<br> 建立MB-QSAR的第一步是进行偏最小二乘法分析。分析的结果包括交叉验证r2,或者叫q2,和非交叉验证得出的r2.q2则作为判定训练集的质量的主要依据。把整个数据库分成训练集和测试集之后,则以训练集为基础来预测测试集的活性,其r2pred值则作为评价模型的预测能力的参数。<br> 最后一步工作涉及到产生立体等式图来分析大分子和小分子的立体相互作用。产生立体等式图的目的是为了能够辅助新的药物小分子的设计。不同颜色的区块代表在那个区域里如果含有某种特别的蛋白激酶和药物小分子的相互作用时则有利于或不利于大分子和药物小分子的结合。通过对比针对同样的药物小分子的两个活性差异比较大的激酶和药物小分子在药物小分子和激酶的结合上的差异则可以看出在哪些区域里什么样的结合特征有利于药物小分子对激酶的选择性。<br> 本文进一步发展了MB-QSAR的应用方式以及范围。其主要的突破点在于:1)首先考虑序列相似程度,用多模板的办法模建蛋白激酶结构,提高了模建结构的可靠性;2)以分子对接的方法获得所研究的小分子药物与蛋白激酶的复合物,解决了不是所有的模板都是复合物的问题;3)参照文献及已知小分子药物与蛋白激酶的复合物晶体,针对对接结果的进一步筛选,更加可靠的确定了我们研究的蛋白激酶与小分子药物的结合构象;4)在上述基础上建立的六个小分子药物与蛋白激酶的MB-QSAR模型里具有良好的药物选择性与蛋白激酶结构的统计相关性,同时提高了模型对药物小分子对蛋白激酶选择性的预测能力。可视的MB-QSAR模型立体等式图则为未来的具有良好选择性的药物小分子的分子设计提供了结构指导。<br> 在复杂的生命体系中,外源性调控分子,如药物,对一组具有类似结构和作用模式的靶标组的选择性是至关重要的。在理论上预测小分子对生物大分子靶标组的选择性对于设计理想的小分子探针和药物,以及理解生命现象的本质,有着重要价值。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文