基于最大相关最小冗余朴素贝叶斯分类器的应用
Application of Naive Bayesian Classifier Based on Maximum Relevance Minimum Redundancy Method
摘要目的 将基于最大相关最小冗余(maximum relevance minimum redundancy,MRMR)的朴素贝叶斯分类器(na?ve bayesian classifier,NBC)应用于基因表达数据并与经典NBC、随机森林(random forests,RF)进行比较.方法 采用Matlab与R软件编程,应用结肠癌与肺癌基因表达数据集,分别采用上述三种方法进行比较研究,使用10-折交叉验证方法估计经典NBC与RF的分类准确率.结果 应用MRMR-NBC分析结肠癌基因表达数据集显示,采用信息熵(mutual information quotient,MIQ)法,当特征m=11时分类准确率达93.55%;而采用信息差(mutual information difference,MID) 法时,当m=15时分类准确率达到95.16%.应用MRMR-NBC分析肺癌基因表达数据集显示,采用MIQ法,当m=14时分类准确率最高达98.63%,而采用MID法时当m=12时分类准确率达到97.26%.而采用经典NBC分析结肠癌与肺癌基因表达数据时,分类准确率分别为66.67%、80.00%;RF在分析结肠癌与肺癌基因表达数据时,分类准确率分别为81.89%、77.62%.结论 MRMR-NBC能在仅有极少属性参与分类时,得到较高的分类准确率,优于经典NBC与RF.
更多相关知识
- 浏览215
- 被引0
- 下载26

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



