论文部分内容阅读
目的探讨不平衡分类的乳腺癌数据集基于机器学习方法预测预后的生存状态。方法乳腺肿瘤预后的生存状态数据为不平衡数据,针对不平衡数据这一问题,本文使用SMOTE、Borderline-SMOTE、ADASYN、One-Sided Select处理乳腺肿瘤生存状态的不平衡数据。然后通过经典决策树、条件决策树、随机森林、支持向量机预测的准确率、敏感度、特异性、正例命中率、负例命中率来评价分类器的效果。结果4种机器学习方法进行乳腺癌预后预测时,未经采样技术处理的原始数据集在预测准确率上均表现良好,其中支持向量机准确率