基于Python构建机器学习探究中药治疗胃癌通路决策树的规律性
Python Based Machine Learning to Investigate the Regularity of Decision Tree of the Pathway of Chinese Medicine in the treatment of Gastric Cancer
摘要目的 胃癌(Gastric cancer,GC)是高发率和致死率"双高"的癌症,临床中药复方治疗GC有大量的证据,表明中医药在GC的治疗方面有着出色的表现.文中针对治疗GC的临床中药组方开展基础性研究,利用其他学科较为成熟的研究思路和研究方式,探究中医药在不同维度层面的规律性.方法 筛选中国知网数据库及中药系统药理学数据库与分析平台(TCMSP)(http://tcmspw.com/tcmsp.php)、BATMAN-TCM 数据库(http://bionet.ncpsb.org.cn/batman-tcm/index.php/)、SymMap 数据库(http://www.symmap.org)建库至 2023 年 3 月 30 日期间治疗GC的文献,利用Python构建决策树模型,通过文献统计有临床治疗证据的GC复方,对高频出现的药物进行分子层面的研究,形成"中药-治疗通路"矩阵,再将无临床证据的"中药-治疗通路"矩阵送入决策树模型进行学习修正,获得治疗通路的关联队列,并通过生物信息学数据分析验证决策树模型的输出结果.结果 (1)筛选出GC高频治理中药共计26味,如白术、黄芪和茯苓等;(2)找到与GC有关的通路共计225条;(3)Python构建的决策树模型进行熵值计算,在225条有临床证据的中药蛋白富集的通路中寻找到的18条对GC有重要作用的通路;(4)决策树模型计算出"Chemical carcinogenesis-Tryptophan metabolism-PI3K-Akt signaling pathway-Anti-gen processing and presentation"关联队列;(5)18条通路在对不同标签中药出现不同的表现,"No"标签中药的高值(深色区域)相对集中分布,而"Yes"标签中药的高值(深色区域)相对散在分布;(6)q值和p值聚类结果提示"Fatty acid biosynthesis"和"Antigen processing and presentation"均指向"1-Yes""Vibrio cholerae infection"和"Dilat-ed cardiomyopathy"均指向"1-No""Breast cancer"和"Protein digestion and absorption"均指向"0-Yes".结论 "Chemical carcinogenesis-Tryptophan metabolism-PI3 K-Akt signaling pathway-Antigen processing and presenta-tion"通路队列,是GC中药治疗通路中的关联队列.生物信息学结果与Python构建机器学习决策树模型结果在判别是否具有GC治疗作用上有着高度相似性,从生物信息学层面印证了决策树算法模型结果的准确性.同时,利用Python构建成熟的计算机模型可以从不同的角度去研究临床复方中药在疾病治疗中的规律性,是临床中药组方研究的一种新的尝试,结合多学科多角度的分析,对中医药的现代研究有积极的推动作用,并且对人类健康发展有着重要意义.
更多相关知识
- 浏览34
- 被引0
- 下载15

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文