【摘 要】
:
面向篇章的文本理解核心在于对篇章知识要素及其关系的检测和抽取,如何定义易于理解和表示的知识要素及其关系,是提高文本理解效果的基础。本文提出一种面向知识理解的文本表示框架,以框架为基础,研究知识要素抽取以及知识要素关系抽取的相关技术,验证并实现了多粒度篇章知识展示平台。本文具体的研究内容如下:(1)设计面向知识理解的文本表示框架,为后续知识要素抽取与知识要素关系抽取提供标准。对篇章知识要素进行分类与
论文部分内容阅读
面向篇章的文本理解核心在于对篇章知识要素及其关系的检测和抽取,如何定义易于理解和表示的知识要素及其关系,是提高文本理解效果的基础。本文提出一种面向知识理解的文本表示框架,以框架为基础,研究知识要素抽取以及知识要素关系抽取的相关技术,验证并实现了多粒度篇章知识展示平台。本文具体的研究内容如下:(1)设计面向知识理解的文本表示框架,为后续知识要素抽取与知识要素关系抽取提供标准。对篇章知识要素进行分类与定义,规范知识要素对应的属性以及相关约束条件,并定义同级知识要素之间的关系。(2)语法要素抽取关键技术研究。在传统模型基础上加入了Bert词向量,解决一词多义问题,提高命名实体识别的准确率,并通过实验验证了其良好效果。同时,在语法要素抽取中提出一种基于Sim Hash和Sentence2Vector的同义句句频计算方法,为后续的句子级语义知识要素抽取提供指导。(3)语义要素抽取关键技术研究。基于知识粒度由细及粗的顺序,依次提出了名为TFIDF-APD的关键词抽取算法、融合关键词信息及主题信息的关键短语抽取方法、基于多特征计算的关键句抽取方法。TFIDF-APD算法是在传统的TFIDF算法基础上,创新性的引入了“词分布”与“词位置”两个因子,提高关键词抽取实验的精度。在关键短语抽取方面,将关键词信息与文本主题信息相结合,基于关键词和主题词完成关键短语抽取,提高关键短语抽取实验的精度。针对关键句抽取,将词级约束特征和句级约束特征进行结合,灵活分配特征权重,实现动态关键句抽取,以适应不同角度的关键句抽取任务,并通过实验验证了算法的有效性。(4)知识要素关系抽取研究。引入位置特征规则,处理词语级知识要素与其指代词之间的指代关系。同时,将Bert模型应用于句间关系抽取,将句子关系抽取任务转化为分类任务,实现了对平行关系、因果关系、转折关系、时序关系、包含关系这五类句间关系的识别与抽取。并通过实验验证了以上算法的有效性。(5)设计并实现了面向单篇章的文本理解平台,对上述的关键算法进行了集成验证。
其他文献
针对行人的航位推算技术越来越成为研究的热门方向,当前的实现方案可以分为依靠环境信号的有源推算方式和依靠可穿戴设备的无源推算方式。其中无源推算对外界环境无依赖,是一种自主的定位系统。其优势在于低成本、高隐蔽性、强抗干扰性,具有实现全场景定位的潜力。然而,由于这类算法估计的是行人的相对位置变换,导致了误差的累积,为实现精确的行人定位带来了挑战。论文针对未知场景下的位置解算任务,重点研究了利用深度学习算
近年来,越来越多的设备正在接入移动网络,设备与设备之间的通信也日益频繁。但是,网络节点之间的通信质量通常会受到信道波动的极大影响。因此为了保证网络节点之间的正常通信,可以采用中继协作方式,通过配置一个中继节点协助进行数据信息的转发。但是,为了避免产生因为中继进行转发服务消耗能量而对自身工作带来的负面影响,就需要选择更加合适的方式来对中继进行额外地能量供应。近年来,无线数能同传技术被广大学者得以研究
TEXONO实验是由海峡两岸合作共同推动的低能中微子实验,目标是研究低能时的中微子物理。不同于国际上大多数低能中微子实验采用放射化学方法或是液体闪烁体,TEXONO实验使用了CsI(Tl)晶体作为探测器。无机闪烁晶体在测量上拥有很多优点,使TEXONO实验有希望给出比其他实验更好的结果。在实验数据分析中,能量信息的获取是最重要的问题。TEXONO实验由于对CsI(Tl)采用了两端读出的方法,因此能
互联网自1969年诞生以来,在各个领域都有不可忽视的建树,同时也给信息安全领域带来了极大的挑战。信息隐藏技术是针对信息安全问题发展起来的,利用不同形式的传播载体实现秘密信息的传递,其中一个分支就是隐写。以图像为载体的隐写技术,从修改操作的作用域进行划分,有空域和变换域两种,并逐渐从无差别对待所有像素点的非自适应隐写发展到关注图像内容并结合编码的自适应隐写,随着深度学习领域的日益火爆和计算机算力的提
随着无线网络的进一步发展,越来越多的设备将在未来接入网络,并带来巨额的网络流量增长。到目前为止,已经有多项新颖的无线技术被提出以提高网络容量、增强信号质量、降低网络时延、提高覆盖范围等。得益于能够建立视距(Line of Sight,Lo S)传输以及能被灵活地部署,无人机(Unmanned Aerial Vehicle,UAV)能够有效地提高无线网络的吞吐量,提高网络的覆盖范围,缓解网络负载。然
随着基于Φ-OTDR技术的分布式光纤声波传感系统DAS在通信光缆安全监测应用中的发展,近年来,DAS信号的特征和信息提取越来越受到人们的关注,因为它直接决定了后续目标识别的成败。如何有效提取DAS信号特征进行正确、稳定的识别一直是DAS在通信光缆安全监测应用中的最大难题。本文对国内外基于DAS的通信光缆安全监测现状进行了调研,发现DAS信号识别采用的方法目前只考虑了信号的人工特征或深度学习特征,忽
大规模多输入多输出(massive multiple-input multiple-output,massive-MIMO)作为第五代(5G)移动通信的一项物理层关键技术,相较传统MIMO拥有成倍增加的天线及射频通道数目,因此在理论上具备非常高的空间分辨率,从而使得无线频谱效率大幅提升。然而,在实际系统开发与部署中,大规模MIMO却时常受困于“低性价比”问题,即硬件复杂度与成本成倍增加,但系统性能
侧信道攻击分析方法是一种强有力的密码安全性分析方法,主要利用加密设备在运行加密算法时泄露的物理信息,从而获得密钥信息。其中,能量分析攻击方法因采集简单与处理方法多样化,而广受研究人员青睐。本文针对椭圆曲线数字签名算法进行能量分析攻击,其主要工作内容如下。本文首先介绍了传统侧信道攻击方法与椭圆曲线算法中标量乘法的常见实现方法,如Double-and-Add标量乘法、经典Montgomery Ladd
功率放大器(power amplifier,PA)是无线通信系统中重要的组成部分,效率、带宽、线性度是PA三个最为关键的性能指标,直接影响整个无线通信系统的工作性能。在谐波调谐(harmonic-tuned,HT)类PA效率提升方面,波形分析一直扮演着核心角色:从波形分析角度入手,通过控制各次谐波,最大程度降低晶体管漏极电压、电流波形的重叠和谐波功率,从而塑造出能够实现高效率的输出波形。此外,“连
在各类新兴技术日新月异的当今时代,信息安全已经逐渐成为了重要的国家战略性问题。保密通信是确保信息安全的重要途径,而混沌通信由于可以提升通信系统物理层信息安全性,因此成为了保密通信领域的热门研究方向之一。在外部扰动下的半导体激光器能够产生稳定的混沌输出,普遍应用在混沌保密光通信中。然而,随着研究的不断深入,传统混沌光通信在实现高速长距离传输上面临一定的局限性。一方面,混沌带宽受限于半导体激光器固有的