论文部分内容阅读
大数据、云计算和人工智能的快速发展,使得传统的电子政务已难以适应当今的新形势,建设一个融合大数据、数字化和智能化的政务平台已成为当今政府寻求发展的新思路。自2017年以来太原市教育局政务大数据平台建设不断取得成就,但是与发达国家和我国先进省市的政务平台相比仍然有较大差距。目前该平台采用的新闻分类方法的分类粒度较粗且分类的准确率较低,对于新闻推荐来说目前该平台使用的推荐方法存在着不能及时反映用户兴趣变化,推荐结果准确率较低和推荐个性化程度较低等问题,本文针对其政务大数据平台存在的这些问题进行了研究。本文对传统的TF-IDF特征提取方法进行了改进,提出一种结合教育政务词库(GE)和特征词位置信息(LF)的教育政务新闻特征提取方法,即ETF-IDF-L特征提取方法,然后分别通过朴素贝叶斯和卷积神经网络对教育政务新闻进行分类,通过实验发现对于一些拥有较少数据量的新闻类别来说基于ETF-IDF-L的特征提取和向量空间模型文本表示方法结合多项式朴素贝叶斯分类模型得到的分类效果较好,对于拥有较多数据量的新闻类别来说基于Word2vec的卷积神经网络分类模型得到的分类效果较好,这两种分类模型的准确度和精度较该平台现有的新闻分类方法均有所提升,解决了太原市教育局政务大数据平台现有新闻分类方法分类粒度较粗且分类准确率较低的问题。本文对协同过滤算法进行了改进,提出将用户的评分均值和当前新闻热度结合在一起的填充方法,解决了传统协同过滤算法的数据稀疏问题,然后将改进的协同过滤方法和基于内容以及用户属性的推荐方法进行融合,构建了一个基于混合策略的教育政务新闻推荐方法。通过实验发现与单一推荐方法相比,该混合推荐方法在准确率、召回率和1值方面都有不同程度的提升,满足了用户的兴趣变化及个性化需求,解决了太原市教育局政务大数据平台现有新闻推荐方法的用户个性化及推荐准确度较低的问题。