基于机器学习的中医体质分类研究
Research on Traditional Chinese Medicine Constitution Classification Based on Machine Learning
摘要目的 采用随机森林的过滤式特征选择方法,筛选出最优特征子集后构建梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型,对平和体质与偏颇体质进行分类研究.方法 选取2756例受试者为研究对象,使用横断面调查法进行问卷调查.采集受试者十二经脉上24个原穴的穴位信号与身高、体重、年龄、性别等信息构建数据集.对数据集预处理后使用随机森林特征选择方法筛选最优特征子集;使用GBDT算法构建基于机器学习的平和-偏颇体质二分类研究;采用十折交叉验证计算准确度、精准度、召回率、F1得分,并综合评价模型性能.结果 筛选出22个特征构成最优特征子集,使用筛选后的特征子集构建的GBDT模型准确度、精准度、召回率、F1得分分别是92.86%、93.65%、93.08%、0.92.结论 随机森林的特征选择方法有助于筛选最优特征子集,GBDT可为中医体质分类研究提供帮助.
更多相关知识
- 浏览12
- 被引6
- 下载9

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文