摘要蛋白质组学是人类生命科学领域重要的研究之一,而蛋白质鉴定是蛋白质组学最基本的研究。串联质谱技术是蛋白质鉴定的核心技术,它通过碎裂技术比如碰撞诱导裂解使肽碎裂,并生成包含肽碎片离子信息的二级质谱。预测这些串联质谱信号和理解这个碎裂过程对高通量蛋白质鉴定非常重要。数据库搜索方法是从串联质谱中鉴定出肽序列最常用的方法,理论质谱预测是这种方法的重要步骤。精确的理论质谱预测能够提高肽序列鉴定的可信度。串联质谱中碎片离子峰的强度受各种肽序列相关的理化特性的影响。利用这些碎片离子的理化特征信息,对碎片离子的强度进行建模,从而能够预测理论质谱。<br> 本文使用深度信念网络算法来建模串联质谱中的强度信息。建模过程分为数据处理、模型训练、结果分析三部分。在进行数据处理时,使用pFind、Mascot、Comet三款蛋白质鉴定软件对数据进行搜索,得到鉴定结果文件。提取出鉴定结果中的肽谱匹配(Peptide-Spectrum Matches,PSMs),再对其进行去冗余、假阳性率(False Discovery Rate,FDR)计算等操作。最终得到高可信、无冗余的PSMs,进而提取出离子特征与强度信息,用于模型训练。在模型训练时,通过交叉验证进行参数选择。在结果分析时,使用皮尔森相关系数作为评价标准,对预测结果进行分析。分析表明,预测得到的理论质谱与实验质谱有较高的相似性。
更多相关知识
- 浏览0
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



