论文部分内容阅读
突发事件具有突发性、难可控性,往往会产生严重的灾害后果并对人们的生命财产安全造成巨大威胁。虽然突发事件预案法可以从宏观层面对应急救援进行指导,但无法从微观角度辅助专家针对具体的突发事件进行应急决策,并且现有人工建立的突发事件知识库缺少进一步的信息抽取和扩展。因此,将安全科学领域的知识与计算机技术相结合,构建突发事件语义知识库(Semantic Knowledge Base for Emergency,E-SKB),并进一步丰富语料和完善语义信息,有利于提高应急决策的效率,为应急决策领域的专家学者提供语义信息数据的支持。本文首先基于半结构化数据,依据关联开放数据规则构建基础E-SKB,在此基础上,针对现有聚类算法在识别重复事件时对事件要素抽取不足的问题,运用层级Blocking的方法对不同新闻网站新闻进行事件要素抽取以扩展知识库实例,并识别出重复突发事件以避免数据冗余。为了挖掘出突发事件所含的实体关系以丰富知识库语义信息,并解决现有突发事件因果关系抽取研究中忽略其他演化关系导致的信息缺失的问题,结合安全科学领域建模并采用基于注意力机制的双向长短时记忆网络(Long Short-Term Memory,LSTM)模型对演化关系进行抽取,通过引入注意力机制来突出关键词汇在句中的重要程度,以提高抽取结果的准确性。实验结果表明,本文提出的方法在事件抽取方面,可减少文档比较次数提高抽取效率并且避免多源数据下的事件冗余;在关系抽取方面,可进一步提高演化关系抽取的完备性和准确性,为E-SKB构建的信息抽取环节提供了技术支持,为突发事件应急决策提供了更为有效的信息。