论文部分内容阅读
语义学是一门研究意义的学科,其中意义即可以包括自然语言的意义,又可以研究逻辑形式系统中的符号解释。从语义学的角度观察,GIS系统为逻辑形式系统中的符号系统,而GIS语义可以理解为用GIS系统来表达的语义,即空间概念。传统语义学主要研究重点在语言学方面。语义研究在不同的行业领域发挥着重大的作用,语义学的经典理论和分析方法已经逐步地渗透和影响了计算机语义、GIS领域的语义发展范围。从语义发展的整个历史来看,语义挖掘至少经历了以下几个阶段,基于自然语言的小规模人工挖掘、基于海量数据库结构化和半结构化数据的自动化挖掘、基于专业领域数据库(如空间数据库)的挖掘。人们逐渐意识到要将非结构化文本与语义挖掘结合起来,使人们可以多方面地认识文本的内涵,并且利用科学的认知理论和方法从文本中找到最佳挖掘点,以获得更多的认识。 GIS调研中,形成了大量的非结构化的需求文本,它们是系统化的小规模的文本,它们隐含了大量的GIS语义,但是这一事实往往被人们忽略。应用语义挖掘的理论和方法,借鉴海量非结构文本语义挖掘的方法和空间数据库挖掘的成功经验,对需求文本进行GIS语义挖掘,将对提高GIS需求过程质量、深入探讨GIS语义共享、GIS的解释标准、开发应用共享等理论问题具有重要的意义,同时也为非结构化文本的空间挖掘提供新的思路。 论文首先系统地介绍了需求文本的形成过程,目的是为了搜集更有价值的需求文本,在这基础之上系统地分析了需求文本的内容、语义特点以及挖掘方向,接着由空间地理认知引出GIS语义、GIS语义场的基本概念,然后对GIS语义挖掘的内容、挖掘框架和挖掘原则进行了总结和阐述。GIS语义挖掘的内容分为狭义的挖掘和广义挖掘,狭义挖掘注重GIS的空间概念,主要从GIS世界中的对象模型、场模型、GIS操作、GIS场景进行挖掘;而广义挖掘主要从GIS系统工程的角度出发,是对GIS、软件需求、业务的系统挖掘,重点挖掘GIS信息共享团体和共享方式、术语和GIS元数据服务、GIS产品上下文范围和产品边界、GIS领域模型和业务模型、GIS功能性需求和非功能性需求等。 最后,论文结合国家863课题——网络化环境污染事故区域预警系统的部分需求文本的内容,给出了基于用户文本GIS语义挖掘的实例,证明了基于系统规模文本GIS语义人工挖掘的可行性以及其在GIS软件需求中的巨大价值,为未来海量文本的GIS语义自动挖掘奠定了基础。