C4.5决策树算法在医疗数据分类中的应用研究Research on Application of C4.5 Decision Tree Algorithm in Medical Data Classification
郭星晨,王青青,王亚
摘要(Abstract):
随着医疗水平的不断提高,借助机器学习方法对大量的医疗诊断数据进行分析成为近年来热点研究方向之一。在介绍C4.5决策树算法的相关理论及建树流程基础上,以竞赛项目中的乳腺癌数据集为基础,对数据集进行预处理,建立决策树分类模型,以可视化形式展示分类结果。实验结果表明,该分类模型可达到较高的准确率,证明决策树算法有助于医疗数据分析应用。
关键词(KeyWords): 分类模型;医疗数据分析;决策树;C4.5
基金项目(Foundation): 安徽省自然科学基金面上项目(1808085MF202);; 安徽省高校自然科学研究重大项目(KJ2018ZD036);; 阜阳市政府-阜阳师范学院横向合作项目(XDHX201706);; 阜阳师范学院科学研究项目(2018kyqd0028)
作者(Author): 郭星晨,王青青,王亚
DOI: 10.13757/j.cnki.cn34-1328/n.2021.02.010
参考文献(References):
- [1]董跃华,刘力.基于相关系数的决策树优化算法[J].计算机工程与科学, 2015, 37(9):1783-1793.
- [2]郭华平,董亚东,邬长安,等.面向类不平衡的逻辑回归方法[J].模式识别与人工智能, 2015, 28(8):686-693.
- [3]周于皓,张红玲,李芳菲,等.局部关注支持向量机算法[J].计算机应用, 2018, 38(4):945-948.
- [4] ZHOU W, WANG H, YANG C, et al. Decision tree based medical image clustering algorithm in computer-aided diagnoses[J]. Journal of Computational Methods in Sciences and Engineering, 2015, 15(4):645-651.
- [5]张晓惠,林柏钢.基于平衡二叉决策树SVM算法的物联网安全研究[J].信息网络安全, 2015(8):26-31.
- [6]史宝鹏,段迅,孔广黔,等.应用分类模型研究迟发性颅脑损伤的影响因素[J].计算机技术与发展, 2018, 28(3):201-204.
- [7]黄锦静,陈岱,李梦天.基于粗糙集的决策树在医疗诊断中的应用[J].计算机技术与发展, 2017, 27(12):148-152.
- [8]邹丽,蒋芸,陈娜,等.基于决策树对支持向量机的医学图像分类新方法[J].计算机工程与应用, 2016, 52(21):76-80.
- [9]任仪.基于决策树的海量医学图像数据挖掘方法研究[J].电子设计工程, 2019, 27(6):33-36.
- [10]李玲,刘华文,徐晓丹,等.基于信息增益的多标签特征选择算法[J].计算机科学, 2015, 42(7):52-56.
- [11] NITHYA N, DURAISWAMY K. Correlated gain ratio based fuzzy weighted association rule mining classifier for diagnosis health care data[J]. Journal of Intelligent&Fuzzy Systems, 2015, 29(4):1453-1464.
- [12] PETERS J. Gini index-based digital image complementing in the study of medical images[J]. Intelligent Decision Technologies, 2015, 9(2):209-218.
- [13]董红斌,滕旭阳,杨雪.一种基于关联信息熵度量的特征选择方法[J].计算机研究与发展, 2016(8):1684-1695.
- [14] BALDWIN J, LAWRY J, MARTIN T. A mass assignment based ID3 algorithm for decision tree induction[J]. International Journal of Intelligent Systems, 2015, 12(7):523-552.
- [15] SARKAR B, KUMAR A. A hybrid predictive model integrating C4.5 and decision table classifiers for medical data sets[J]. Journal of Information Technology Research, 2018, 11(2):150-167.
- [16] ZHU F. A classification algorithm of CART decision tree based on mapreduce attribute weights[J]. International Journal of Performability Engineering, 2018, 14(1):17-25.