论文部分内容阅读
近年来国家电网公司不断深化综合计划管理,在原来的基础上共设置了电网基建、生产技改、生产大修、小型基建、零星购置、非生产技改、非生产大修、营销授投入、信息化投入、研究开发、管理咨询、教育培训、产业基建、产业技改、产业大修、股权投资16个专须项目。这不仅是强化了项目管理,而且对经研院的评审支撑作用提出了更高的要求。这就需要经研院的评审人员从专业和技术经济角度,充分论证项目必要性,评审人员需要严格按照国家和公司相关标准要求,优化实施方案和设备选型,明确项目投入估算。因为西藏经研院从事评审工作的人员较少,所以每一位评审人员都需要阅读大量的专项项目可研送审报告,然后判断其可研送审报告内容是否完整,建设是否必要、方案是否可行、估算是否准确。针对上述问题,本课题通过文本相似度在可研评审工作中的应用,开展专项项目可研送审报告的预审工作,为评审人员的评审工作提供辅助作用,为其判断该专项项目可研送审报告是否应用专项项目可研报告模板以及专项项目可研送审报告内容是否完整。本文简要对文本相似度算法的国内外研究现状进行了介绍分析,阐述其基本原理和优点,并提出其存在的局限性,从而开展论文所提出的基于隐性狄利克雷分配(Latent Dirichlet Allocation,LD.A)的相似度度量算法为基础的相关工作。本文通过停用词过滤、分词及诃频统计、文本主题挖掘、文本聚类和评估结果搭建完成文本相似度计算实验。本文利用阿里云的PAI平台实现文本相似度计算实验。该实验已经在不同的专项项目可研送审报告得到了应用,已经取得明显的效果。其提高了项目评审的工作效率,对专项项目可研送审报告进行了预审,剔除内容不全的专项项目可研送审报告,使评审人员把更多的精力放在审核符合预审要求的报告上,对其建设必要性、方案是否可行等方面的审查,进而提高了可研评审质量,为综合计划管理提供了支撑。