基于机器学习的高维数据分类特征选择

杨艳平, 李荣

湖南文理学院学报(自然科学版) ›› 2025, Vol. 37 ›› Issue (1) : 23-31.

PDF(468 KB)
PDF(468 KB)
湖南文理学院学报(自然科学版) ›› 2025, Vol. 37 ›› Issue (1) : 23-31. DOI: 10.3969/j.issn.1672–6146.2025.01.005

基于机器学习的高维数据分类特征选择


作者信息 +
文章历史 +

摘要

针对高维数据中弱相关特征的消除和有价值特征的识别问题, 提出一种递归消除—决策树特征选择算 法, 以提高高维数据分类性能。为了验证该算法的有效性, 从 UCI 数据库中选择了电离层、胶质瘤和恶意软 件 3 个数据集, 通过探索无特征选取、递归消除、决策树和混合算法递归消除—决策树 4 种特征选择方法, 并 分别和逻辑回归、随机森林、支持向量机、线性回归不同分类器组合进行实验。实验结果表明, 对给定的数 据集及 4 种分类器, 递归消除—决策树算法在准确率、召回率等意义下均优于无特征选取、递归消除及决策 树特征选择算法, 与此同时, 随机森林方法在所有实验组中表现最好。

关键词

分类 / 特征选择 / 递归消除—决策树 / 机器学习

引用本文

导出引用
杨艳平, 李荣. 基于机器学习的高维数据分类特征选择[J]. 湖南文理学院学报(自然科学版). 2025, 37(1): 23-31 https://doi.org/10.3969/j.issn.1672–6146.2025.01.005
中图分类号: P 315.69   

PDF(468 KB)

Accesses

Citation

Detail

段落导航
相关文章

/