基于强化学习的命名实体识别方法研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:gtsmk2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别(NER)是自然语言处理(NLP)中的一项重要任务之一,该任务是研究如何在给定的文本中的识别出来具有特定意义的命名实体。大多数早期的NER研究都是基于手工制定的规则,这些规则在实践中表现有限。深度学习已成为NER任务的最新方法,该方法将问题建模为序列标记任务,从数据中自动学习的特征。但是,获取NER的标注数据非常昂贵,所以缺乏高质量的标记数据仍然是限制NER任务在不同领域发展和影响训练模型性能的主要瓶颈。针对上述问题,本文提出了两种在没有标注语料和专家知识的情况下进行领域命名实体识别的任务的方法。主要工作如下:1.本文提出了一种迭代的基于模板的半监督方法—CPL,完成了领域NER任务。通过给定少量的初始种子实体,迭代的在大规模语料库中抽取更多的实体,通过多种约束条件过滤学习新的实体和抽取模板。本文还引入了基于hearstpattern的并列词语集合进行实体抽取,以便更充分地利用语料提供的信息,增加命名实体识别的效率。针对领域实体的特点,使用领域词性模版的方法,提升领域实体的识别率。2.本文提出了一种基于强化学习去噪的命名实体识别模型(RLNER)。该模型有两个模块:标签修改器模块和标签预测器模块。标签修改器通过强化学习来纠正错误的标签,并将校正后的标签输入到标签预测器中。标签预测器做出句子级别的判断,并为标签修饰符提供奖励。通过联合训练两个模块,以优化标签校正和标签预测过程。3.实验结果表明,本文提出的CPL方法可以在大规模未标注语料中抽取通用领域和特定的实体。RLNER方法可以通过少量正确标记的数据,有效处理原始数据中的噪声,与现有方法相比,方法2的模型在带噪音的NER任务中获得了更好的性能。
其他文献
近年来,乳腺癌在女性疾病中的发病率越来越高,同时也是导致女性死亡最严重疾病之一。为了有效并且及时地发现乳腺癌,提高患者的生存质量,越来越多的研究人员致力于乳腺癌图像
由介质光波导组成的微环谐振器作为新兴的微纳集成光子器件,具有高灵敏度、高集成度和结构简单易于设计和优化等优点,是研究光学通信的热门方向。随着光波导器件制作工艺的不
鸟类巢寄生者与其宿主间的博弈对抗过程是研究协同进化军备竞赛的经典模型之一。这种依赖于宿主繁殖特征的种族延续策略的适应性进化取决于其宿主的反寄生防御的强度与适应。
近年来,互联网程序化广告投放技术日渐成熟,完善用户精准画像成为提升营销效果的重要环节。受到疫情中病毒传染模型的启发,线下场景数据既然能够用于精准隔离说明也能够用于
近年来,深度学习算法在图像分类任务上达到了人类级别的分类准确率,使得人们开始尝试将深度学习算法应用到诸如高速公路车辆分类这样的现实场景中去。但实际应用场景下由于存
以过氧化二异丙苯(DCP)为引发剂,马来酸酐(MAH)为单体,甲基丙烯酸丁酯(BMA)为共单体,在转矩流变仪中熔融接枝全同聚丁烯-1(iPB-1),探究了接枝物iPB-g-MAH-co-BMA的最佳制备工艺。结果
阅兵仪式在中国有着悠久的历史,随着中国社会的发展已形成具有中国特色的阅兵文化。建国七十周年阅兵仪式是中国进入特色社会主义新时代后的首次国庆阅兵,也是人民军队全面改
作为新颖的碳基纳米材料,石墨烯和碳纳米管已经在众多领域引起了人们的广泛关注,这两种碳基纳米材料由于具有比表面积大、良好的导电性等许多优异的特性,被应用于电化学生物传感器方面。作为电极材料,它们能够有效的促进酶与电极间电子的传递。基于此,各种氧化还原蛋白质或者酶与石墨烯和纳米碳管结合被用于构筑修饰电极,进而构建电化学传感器。然而,由于石墨烯和碳纳米管固有的缺点,诸如它们在水溶液中往往具有疏水性,且石
随着我国经济的发展,农业生产的商品化和专业化程度越来越高,家庭联产承包经营方式与社会化大市场之间的矛盾开始凸显,随之各种类的农村经济组织不断出现,农民专业合作社就是
错案问题与法律的正确实施、公民的权利保护相关,牵涉重大,而错案判准又为其核心,判准即为标准。然纵观国内理论与实践,观点和研究方法却落于偏颇或理想化,有必要从法理学视