核主成分分析法在酒店数据文本分类中的应用
Application of Kernel Principal Component Analysis in Text Classification of Hotel Data
摘要核主成分分析法作为一种非线性数据处理方法,被广泛应用于数据降维.文章将核主成分分析法应用于中文文本分类领域,使用核主成分分析法对酒店评论数据集进行特征提取.然后,基于核主成分分析法降维后的数据,对比极端梯度提升算法和逻辑回归算法的文本分类效果.实验结果表明,核主成分分析法能够有效去除数据冗余,提升中文文本分类的准确率和查全率.相较于极端梯度提升算法,逻辑回归算法在训练集和测试集上的分类准确率差距不大,模型的泛化能力较好.
更多相关知识
- 浏览1
- 被引1
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



