【摘 要】
:
随着我国司法改革的不断推进,司法机关开始面临审判业务日益复杂、案件日益增多的新形势。通过研究裁判文书中的命名实体识别,能够加快用户对无规则文本内容的理解以及对关键
论文部分内容阅读
随着我国司法改革的不断推进,司法机关开始面临审判业务日益复杂、案件日益增多的新形势。通过研究裁判文书中的命名实体识别,能够加快用户对无规则文本内容的理解以及对关键内容的把握。为法院后续的证据认定、情节认定、判决结果分析与程序合规性等分析打下基础。目前,深度学习理论和实践已经广泛应用于自然语言处理,并取得了良好的效果。本文将深度学习应用于法院裁判文书的研究。借鉴基于深度学习中的长短时记忆神经网络,提出了加入了条件随机场转移层的LSTM模型。训练得到带有上下文信息的模型,更符合文本信息的语言学特征。由于目前国际上没有裁判文书领域的公开规范标注语料,本文一方面通过大量的新闻领域标准语料学习得到LSTM模型,一方面将新闻领域的语言学知识通过深度学习加载预训练词向量的方法融入裁判文书语料,并将预测结果叠加至训练集进行迭代训练,对裁判文书领域的模型进行了参数选择,最终模型的F值达到了0.807。本文的创新点在于利用迁移学习的思想进行跨领域的命名实体识别,取得了较好的效果。
其他文献
动漫产业作为当下的朝阳产业之一,近几年获得了迅速成长。杭州作为我国动漫产业发展的重点城市,多年来始终将动漫产业发展作为城市发展新的驱动力,给予大量政策扶持并不断为产业发展创造优良环境。然而,由于动漫产业自身“轻资产,高风险,高投入”的特殊性,较高资金壁垒一直是阻碍动漫产业发展的问题之一。银行业作为传统的融资渠道,在支持动漫产业等文创产业发展中有着十分重要的作用。动漫产业作为一种新兴产业,需要银行业
将人工智能技术应用于在线教育平台是现代教育领域的迫切需求。目前的线上教育现状显示,优质的老师仍然是稀缺资源,这制约着在线教育的大规模普及;同时,目前的国家政策指出:“为解决社会的教育需求,应当将人工智能应用到在线学习教育平台中去”。基于自然语言处理技术为学生自动地推荐相似的题目是人工智能在线教育领域中的核心应用,它能够帮助学生掌握知识点。设计合适的习题相似度模型,对于提升习题推荐质量、提高教学效率
本文分析了Cahn-Hilliard方程基于混合有限元方法离散的三种半隐格式的稳定性和误差估计,并通过数值算例验证了两种格式的收敛阶,其中稳定性分析是通过能量估计进行分析的,即
近年来,电动汽车领域快速发展引发的能源需求激发了对高能量、高功率密度锂离子电池的广泛研究。层状富锂锰基正极材料xLi2MnO3·(1-x)LiM02(0≤x≤I,M=Ni,Co,Mn)具有高工作电压、高比容量(250-300mAhg-1)和低成本等优点,被视为下一代满足高能量密度需求最有希望的正极材料之一。然而,富锂锰基正极材料在循环过程中面临着较差的倍率性能和电压衰减,以及由Li2Mn03相活化
塑料被广泛应用于日常生活中,由于其来源于不可再生的石油资源,且无法自然降解,对环境造成了严重负面影响。淀粉作为一种天然高分子化合物,其来源广,价格低,具有良好的生物降
微凝胶是一类具有溶胀能力以及溶剂保持能力的微纳米级水凝胶颗粒,利用其多孔溶胀的特性,一类具有高渗透性、高生物相容性的微米级培养单元即可实现构造。活细胞或微组织的引
十九大报告提出实施乡村振兴战略,该战略已被写入党章,是推动国计民生的重要手段,是解决“三农”问题的重要抓手,该战略明确提出了产业兴旺、生态宜居、乡风文明、治理有效、
无线射频识别技术(RFID)作为现代自动识别中拥有强烈优势的技术,在物联网中应用广泛,例如监控物流、管理库存等。它是通过将RFID标签附于物品上利用射频通信实现的非接触式自动识别技术。根据实际的应用需求,现有的研究中有很大一部分集中于丢失标签识别应用的研究上。目前,大量现有的相关研究都是在无任何未知标签参与的假设条件下完成丢失标签的识别,然而实际环境通常是动态的,即总会有其他的未知物品进入监控范围
Mg-Al-RE(稀土)合金是为高温应用而开发的压铸镁合金家族之一,可在温度超过150°C的环境中服役,如工作温度达200°C的汽车动力传动系統。其中AE44稀土镁合金由于具有良好的强
延迟焦化是一种热裂化工艺,其主要的目的就是把高残碳的残油转化为轻质油。焦化后生成的焦炭附着在塔壁上,在进入下一次生焦生产前,需要进行除焦操作。水力除焦是目前常用的一种除焦手段,其主要利用高压水不断冲击焦炭塔内的焦炭使其脱落并从塔底溜槽流出。在目前的除焦操作中,焦炭除尽程度完全依赖操作工的人为观测判断。其劳动强度大、工作环境恶劣,判断的主观性误差大。本文旨在通过对焦炭塔在高压水冲击下的振动信号采集并