面向社会安全事件的属性知识库构建方法研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:PoolD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会安全事件因其巨大的危害性与传播的广泛性,一直是国家安全管控的重点对象。近些年来,国内部分行业快速发展的同时相应的安全管理办法未能及时跟进,导致各类事故频发;同时,由于我国国力的快速增长,许多境外反动势力动作频繁,尽其所能试图制造分裂与骚乱,社会安全事件防范的态势愈加严峻。随着互联网的快速发展以及以微博为代表的社交媒体广泛普及,每当事件发生时都会有大量的报道与讨论出现在互联网上,在其中蕴含了许多有价值的但难以被直接利用的数据。有鉴于此,本文提出一套面向社会安全事件的属性知识库的构建方法,旨在从海量网络数据中提取和管理有价值的信息,对事件进行全面的刻画,为事件的分析与管控提供有力支撑,研究内容主要包含以下五个方面:(1)社会安全事件属性体系设计与数据资源库构建方法研究对社会安全事件的特点进行分析,结合查询与分析具体需求,设计了由4大类21小类构成的社会安全事件属性体系;以微博为数据源,使用Scrapy框架按关键词对相关数据进行搜索与采集,并通过噪声过滤、繁简转换等预处理操作,构建了一个无效信息少、格式规整的数据资源库。(2)面向社会安全事件的事件关系强度计算方法研究提出了一种多特征融合的事件关系强度计算方法,用以对知识库中的事件关系属性进行提取。通过对关联事件存在共性的部分进行挖掘与分析,提出以关键词相关度、热度关联度以及关注用户重合度三个特征作为事件关系强弱的判断依据,将多特征加权融合得出最终的事件关系得分。实验表明,本方法能够对事件之间的关系强度进行合理的表示。(3)面向社会安全事件的摘要抽取模型研究提出了一种结合Bert预训练模型与冗余处理方法的抽取式摘要模型,用以对知识库中的事件摘要属性进行提取。使用Bert模型进行向量提取,获得包含深层语义信息的文本表示;从语义与词形两方面出发,对候选句子之间的相似度进行综合计算,并以相似度为依据进行冗余处理。实验表明,本文提出的摘要抽取模型具有较好性能,同时有效缓解了摘要结果冗余的问题。(4)面向社会安全事件的公众情感分析模型研究提出了 一种融合词语性质与注意力机制的情感分析模型,用以对知识库中的公众情感属性进行提取。考虑到词语的词性以及情感极性对于文本最终要表达的情感起着重要作用,将二者分别进行向量化表征后与词向量融合作为模型输入,使用Bi-LSTM模型对文本的语义信息进行建模,结合注意力机制实现了情感分析模型的构建。实验表明,通过对词语性质的融合与利用,本模型能够在情感分析中取得较好效果。(5)面向社会安全事件的属性知识库系统设计与实现对系统的整体架构进行了设计,对各子模块功能进行了实现,结合前述算法与模型,实现了事件各属性的提取,完成了事件属性知识库的构建。使用Lay-ui框架构建了页面,实现了知识库的可视化展示。
其他文献
液体肥是一种通过灌溉系统施用,利用率高、见效快的新型肥料。配制液体肥需满足氮磷钾大量元素的配比要求,受溶解度限制,液体肥在低温下常出现结晶、沉淀等现象,这不仅影响肥料的利用率,也会造成输送设备和喷滴头堵塞等问题。本文在常温和低温下对五种钾盐(KCl、KNO3、KH2PO4、K2HPO4、K2SO4)两两组合的混盐在水中的液固相平衡进行研究,为液体肥的配方设计提供基础数据。主要研究内容如下:(1)通
~~
会议
合成气制低碳醇是目前极具发展前景的工艺之一,其产物复杂,目标产物低碳醇尤其是C2+OH的选择性较低,解决该问题的关键是开发高催化性能的催化剂。本文利用量子化学模拟手段研究了 CuFe催化剂两个不同面上的碳链增长机理,确定了一个更高C2+OH选择性的表面,可以用于指导高催化性能CuFe催化剂的结构设计。利用Wulff重构方法确定了 CuFe催化剂的两个主要低密勒指数暴露面(100)和(110),并计
厦门地区包括厦门本岛以及岛外附近郊区,亦即现在厦门市所管辖范围的厦门本岛(即厦门岛)、集美区、杏林区、鼓浪屿区、海沧区和同安区等地方,在古代(除本岛外)曾生产过各类
会议
本论文以探索醋酸锰催化的呋喃重排反应以及发掘反应的药用价值为目的,对呋喃重排反应进行了系统性的探索和研究。使用呋喃取代化合物作为底物,以醋酸锰为催化剂以及氧气为氧化剂,可以合成得到含有多官能团的环己烯酮,再对反应进行条件优化和机理研究后,应用该环己烯酮的多官能团性质构建出具有潜在药物活性的苯并呋喃衍生物和笼状化合物。本文用新发现的呋喃重排反应合成得到多官能团中间体化合物,通过对比实验探索出重排反应
红色糖多孢菌是生产大环内酯类抗生素红霉素的主要工业菌株,构建完整可靠的全基因组代谢网络模型(Genome-Scale Metabolic Model,GSMM),对深入了解红色糖多孢菌代谢机制,从而高效开展新菌株构建、全合成培养基设计及发酵工艺优化放大等研究,具有重要意义。目前已公开发表的红色糖多孢菌GSMM,存在着结构描述不完整、未充分整合多组学数据等问题,导致其性能有限,限制了应用范围。本文基
白藜芦醇(Resveratrol)是一种非类黄酮类多酚化合物,因其具有的抗炎、抗癌、抑菌等功效,已被广泛应用于保健品、食品、医药和化妆品等领域。但是存在于植物中的天然白藜芦醇含量较少,且提取过程成本高。近年来,研究者们致力于利用植物细胞悬浮培养技术来生产白藜芦醇。本文研究了葡萄(Vitis vinifera L.)悬浮细胞合成白藜芦醇的培养过程,旨在发现建立悬浮体系的最适葡萄愈伤组织及其生长代谢过
离子液体在CO_2吸收中的应用已被广泛地报道,其所具有的理化性质如不挥发性、热稳定性和结构可调性等,被认为是最具有潜力的CO_2吸收剂来替代目前工业中常用的醇胺水溶液。其中,对CO_2同时具有化学和物理吸收作用的离子液体(化学-物理吸收型离子液体),因其对CO_2具有高效吸收和活化的能力而成为研究的热点。但当前缺乏有效的方法来准确测量化学-物理吸收体系中CO_2的化学和物理吸收量,这对理解CO_2
闽南地区的成熟瓷器生产的历史可上溯至南朝,宋元时期,由于海上贸易的发展,闽南地区的陶瓷业进入了鼎盛阶段,窑口众多,产品丰富,远销海外.随着对闽南陶瓷研究的深入,窑业技术
本研究通过对新乡市2017各季节年PM2.5进行阶段性连续采样,结合空气污染物的在线监测数据,1分析大气污染物及PM2.5中化学组分的污染特征,结合同期正常人群体检数据,运用广义