太原市教育局政务大数据平台的新闻分类和推荐方法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:fmf001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据、云计算和人工智能的快速发展,使得传统的电子政务已难以适应当今的新形势,建设一个融合大数据、数字化和智能化的政务平台已成为当今政府寻求发展的新思路。自2017年以来太原市教育局政务大数据平台建设不断取得成就,但是与发达国家和我国先进省市的政务平台相比仍然有较大差距。目前该平台采用的新闻分类方法的分类粒度较粗且分类的准确率较低,对于新闻推荐来说目前该平台使用的推荐方法存在着不能及时反映用户兴趣变化,推荐结果准确率较低和推荐个性化程度较低等问题,本文针对其政务大数据平台存在的这些问题进行了研究。本文对传统的TF-IDF特征提取方法进行了改进,提出一种结合教育政务词库(GE)和特征词位置信息(LF)的教育政务新闻特征提取方法,即ETF-IDF-L特征提取方法,然后分别通过朴素贝叶斯和卷积神经网络对教育政务新闻进行分类,通过实验发现对于一些拥有较少数据量的新闻类别来说基于ETF-IDF-L的特征提取和向量空间模型文本表示方法结合多项式朴素贝叶斯分类模型得到的分类效果较好,对于拥有较多数据量的新闻类别来说基于Word2vec的卷积神经网络分类模型得到的分类效果较好,这两种分类模型的准确度和精度较该平台现有的新闻分类方法均有所提升,解决了太原市教育局政务大数据平台现有新闻分类方法分类粒度较粗且分类准确率较低的问题。本文对协同过滤算法进行了改进,提出将用户的评分均值和当前新闻热度结合在一起的填充方法,解决了传统协同过滤算法的数据稀疏问题,然后将改进的协同过滤方法和基于内容以及用户属性的推荐方法进行融合,构建了一个基于混合策略的教育政务新闻推荐方法。通过实验发现与单一推荐方法相比,该混合推荐方法在准确率、召回率和1值方面都有不同程度的提升,满足了用户的兴趣变化及个性化需求,解决了太原市教育局政务大数据平台现有新闻推荐方法的用户个性化及推荐准确度较低的问题。
其他文献
BIM技术的出现是工程行业的一场革命,项目全生命周期协同化程度不高、信息共享和交换不及时是工程项目中一直存在的问题,BIM技术的出现为此问题提供了一种解决途径。它通过信
目的:分析社区医院治疗慢性阻塞性肺疾病的效果和预防措施。方法:选取我院2014年1月至2014年8月期间收治的56例慢性阻塞性肺疾病患者和在家中使用常规药物进行治疗的58例慢性
通过分析了解国际工程机械产品技术发展特征及国内工程机械产品技术发展的差距,提出了我国工程机械产品技术发展的一些对策.
目前,我国工业化及城市化进程处于快速发展阶段,城乡一体化速度也在不断加快,居民的消费水平有了明显提高,消费结构也在不断地变化,农业更是迈入了一个新的阶段,传统农业开始
2009年12月2日,本溪钢铁集团南芬矿扩产项目首批3台卡特彼勒789C大型矿用卡车交机投产仪式在南芬矿现场顺利举行,揭开了全球最大矿用设备制造商卡特彼勒公 December 2, 2009