论文部分内容阅读
研究生招考工作是我国最高层次人才选拔的入口,合理的选拔制度不仅是研究生培养质量的基本保证,而且直接影响到国家科教兴国的基本国策。随着我国研究生招生的报名和录取人数的不断增加,以及国家科技和经济的不断发展,研究生的招录标准和培养目标发生了翻天覆地的变化,因此,如何深化研究生招生政策和招生制度的改革,提高研究生招生管理部门的工作效率,选拔录取合格的、优秀的研究生,已经是各级研究生招考机构面临的重大难题。 本文在构建研究生招生信息数据仓库的基础上,利用数据挖掘技术,从宏观上把招生信息数据集作为一个有机整体进行知识发现研究,以找到研究生招生信息中隐藏的一些规则,对各级研究生招考机构已进行的改革做出客观的评价,从而对将来的改革方向做出一些探索性的建议。 本文主要以江苏省2004-2010年的研究生报考数据和复试录取数据为基础,构建了研究生招生信息数据仓库,并通过数据整合,数据清理,数据转化和属性约减保证了信息的完整性和准确性。本文随后采用主题分析、联机分析处理、决策树分析和关联规则分析等基于经验数据挖掘方法对数据进行了详实分析。在联机分析处理中,分别从考生来源、时间、学习形式、婚否等维度对报考和录取结果进行分析,得出了不同纬度下考生报考和高校录取间的潜在信息和知识,并对原因进行了详实的分析。在决策树分析中,通过对考分、211高校、985高校等方面的决策树分类挖掘,分析了各因素对于录取率的影响程度和原因。 为了验证挖掘结果的有效性和准确性,本文还利用基于频繁模式树的频繁闭项集挖掘算法,通过构造频繁闭项集关系图,发现不相邻的频繁闭项集之间隐含的关联规则,根据最小生成项集产生无冗余关联规则,从而有效的解决规则之间的冗余问题。从理论上对研究生招生信息中考生分数和录取之间的关联关系进行了详尽的数据挖掘分析,并对分析结果的原因进行了定性分析,对于进一步提升研究生招生录取工作质量和效率具有一定指导意义。