基于语义树的司法判决文书分析方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:cs_200901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
法官的判案是以事实为依据,法律为准绳,通过对案件发生过程的分析,对案件进行判决。因此,智能司法研判的研究对象也就是事实文本,即后文提到的司法文本。目前,司法文本的分析主要是关键词匹配和词嵌入模型,忽略了司法文本自身所存在的语义逻辑性和文本的结构特性。语义依存树可以将文本解析为树的形式,利用树的结构特性,将文本的语义与结构相结合,更符合司法判决的逻辑。将语义依存树的解析结果拆分,就得到语义依存三元组的序列集合。论文利用多通道卷积实现案件发展过程的语义逻辑分析,对司法判决预测进行了研究,论文的主要工作如下:(1)司法文本中的人名,地名是智能司法研判的基本元素。由于案件的多样化,不同案件中出现的人名与地名复杂且多样,常见的文本分析工具不能将各成分很好的拆分出来。因此论文采用命名实体识别技术,提出了基于词性注意力的命名实体模型:BLAC。该模型在BI-LSTM-CRF模型的基础上,添加了词性注意力层,将词性信息与语义信息相融合。论文分别使用BLAC模型与BI-LSTM-CRF模型在不同数据集上进行了实验。实验结果表明,使用了词性信息的BLAC模型在各指标上均优于BI-LSTM-CRF模型。(2)针对常见停用词方式会破坏文本结构的问题,论文从司法文本数据的特点出发,使用多实体融合与实体替换的方式,在不影响文本语义与结构的前提下,对词向量空间降维。主要方式是将受害人与犯罪人以外的人名归一化,使用指定的人名替代不同文本的对应的受害人与犯罪人的姓名,并在多个模型中比较停用词方式、不对文本处理的方式以及本文提出的多实体融合与实体替换的方式,实验结果表明实体替换的效果要优于其余两种方式。最后使用CRNN+Self-attention模型作为论文使用的司法判决的模型,并与其余模型对比,实验表明,在多实体融合与实体替换的基础上,CRNN+Self-attention模型的效果最好。(3)针对现有的司法判决方式大多不注重文本结构特性的问题,论文使用语义依存分析获取文本的语义结构树信息,并将其依存三元组的序列结合作为特征,提出了基于依存关系的De CRNN模型。该模型使用多通道卷积分别提取依存三元组的特征信息,并使用RNN层提取文本的序列信息。实验结果表明,使用依存信息的De CRNN模型相比不使用依存信息的各模型都有一定的提升,与使用注意力机制的模型相比,也具有一定的竞争力。
其他文献
窄带物联网技术(NB-IoT)因其覆盖广、容量大、成本低及功耗低等优点,受到越来越多的关注,技术也取得了飞速发展。中国移动积极把握技术演进趋势和万物互联时代特征,明确了“十三五”时期做大连接规模、做优连接服务、做强连接应用的大连接战略,力在推动物联网生态体系的发展与构建。本文根据中国移动2017年部署NB-IoT商用的战略要求,结合临沧移动的网络结构以及现状,对临沧移动NB-IoT网络的组网方案进
推特作为全世界最流行的网络社交媒体之一,主要由非结构化的短文本为主,这使得推特成为自然语言处理领域重要的数据来源与研究对象。人们利用推文交流知识、表达观点、抒发情感,研究推文中的情感对内容推荐、产品评价、舆情监管等许多领域都具有着积极的意义。随着推特平台技术的发展,表情符号的使用越来越频繁,传统的纯文本情感分析技术很难感知复杂推文的情感倾向。论文通过对推特场景下的推文文本及表情符号进行研究,探求推
随着社会的发展,人们对移动通信网络的要求越来越高,传统的宏蜂窝网络已经不能满足人们对高速率、低延时、大容量的要求,网络的密集化部署已经成为一个趋势,因此具有诸多优点的小蜂窝网络得到了越来越多的关注。随着网络速率的提升,互联网应用也得到了蓬勃发展,如在线音乐、视频、购物等,越来越多的人通过手机、平板等移动设备来使用这些丰富的互联网应用,这产生了巨大的网络流量,加重了网络的负担。为了缓解流量压力,缓存
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种先进的遥感探测系统,在过去的几十年中得到了广泛的应用。近年来提出了广角观测的概念,用于构造更大的合成区间。在广角SAR观测条件下,许多被照射物体的散射特性会随着观测角度变化,导致传统的成像算法重建图像的分辨率和解析力降低,不利于图像解析和目标识别。此外,SAR系统相位误差也会造成图像模糊,需要采用自适应相位补偿技术来解
金属结构裂纹损伤隐蔽性强危害大,裂纹的定量化检测技术是当前结构健康监测研究热点之一。现有的基于压电阵列的导波结构健康监测往往忽略裂纹方向信息,无法对裂纹损伤做出有效评估。本文深入分析裂纹对Lamb波监测信号传播产生的影响,引入环形压电阵列及主动Lamb波RAPID成像技术对裂纹损伤的定量监测技术进行研究。通过提出的十字交叉扫描方法弥补传统RAPID成像技术对于裂纹的局限性。本文从下列4个方面进行研
随着现代科学技术的飞速发展和自动化水平的提高,使用计算机系统控制的设备也在逐渐增加,不断投入到电信和政府等的数据中心和机房中使用,随着各类用电设备数量的不断增加,配电系统故障率和安全事故的风险日益增大,人员维护难度也急剧增长,因此需要与这些高性能的设备相配套的配电监控系统。为了解决上述问题,本文实现了一种基于数据挖掘技术的智能配电监控系统,该系统解决了传统配电监控系统的缺点,提高了机房配电的智能化
随着移动互联网和无线通信技术的不断创新,移动应用与服务的数量一直保持着快速增长,使得运行在移动设备上的计算密集型任务越来越多,例如人脸识别、交互式游戏以及增强现实等,通常执行这些计算密集型的任务需要占用设备大量的计算资源和能耗。与此同时以智能手机、平板电脑、车载终端等为代表的智能终端的数量也出现指数级别增长,这些异构的终端在电池容量、内存空间、CPU计算能力等性能方面存在较大的差异,有大量的终端设
近年来,云计算已经成为信息产业的关键支撑技术,各行各业都借用云计算提高了自己企业的运行效率。与此同时,随着5G网络时代的到来,人们正在进入一个万物互联的智能时代,越来越多的移动终端设备需要执行计算密集型任务,这些任务在移动终端的卸载必将导致过高的时延和能耗,而在云端执行又因传输距离过远而又产生过高的传输时延,这两种任务卸载方式都无法满足某些应用程序低时延的要求,同时,有限资源的移动终端与计算密集型
学位
学位