论文部分内容阅读
我国对于工程建设领域行为规范的约束和引导是通过标准的采纳和执行来实现的。工程建设标准在保证施工安全、建设质量方面具有重要作用,工程建设标准的采纳可以促进社会经济发展,推动科学技术进步,使建设建造水平得以提高。但是,在检查标准执行情况时,现场人员需要翻阅相关标准文档,逐一查找,存在查阅费时、审查错漏等问题。解决工程建设标准的检索问题,加强计算机对标准查询的支持,对于提高标准的审查效率、保证标准采纳水平、完善施工过程具有重要意义。工程建设标准作为建筑行业的建造准则,有着格式规范、分类较多、逻辑严谨、结构清晰、用词简明和规定明确的特点,根据工程建设标准的这些特点和现有的标准检索方式,本文提出我国工程建设标准检索的需求分析。概念图作为一种语义检索方法,比关键词检索的查全率和查准率更高,据此,本文提出通过构建概念图的方式实现工程建设标准检索的目的,并重点研究了工程建设标准概念图自动构建的过程。在概念图的构建过程中,本文利用最大熵模型,根据上下文信息进行机器学习,达到识别标准条文中基本名词短语的目的。通过区分强制性标准和推荐性标准编写规则的不同,分别制定了两者谓语中心词识别的方法。谓语中心词所在的语句被称为主干模板,文章采用逐步分析的方法,先构建主干模板的概念图,然后再构建非主干模板部分的概念图,最后将两者合并,形成完整的概念图。工程建设标准概念图构建过程完成后,文章对其影响因素进行了分析。本文通过因子分析的方法,对指标进行归纳总结,将影响因素分为概念图广度、概念图关系和概念图信息量三个公共因子,并将其与概念图自动构建过程进行结合分析,提出概念图自动构建的优化路径,为进一步研究概念图在工程建设标准领域的应用奠定了基础。