低资源条件下的多语言实体链接技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：zhongguohuhu

【摘要】

：

【作者】

：

吴杨

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2020年期

【关键词】

：

资源条件语言实体链接目标领域知识库自然语言处理多语言样本问题标注信息文本接方法问答系统统计数据

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

众所周知，在很多自然语言处理的任务中，知识库所起到的作用是不可或缺的，比如问答系统，自然语言推理等等。而实体链接，也就是在知识库中找到一段文本所包含的实体，很多时候是作为这些自然语言处理任务的上游基础任务存在的，因此实体链接可以说是一项非常重要的工作。
　　自实体链接任务发展以来，标准实体链接任务的链接目标都是类似Wikipedia这样的大型百科知识库，这类实体链接方法的准确率已经达到了很高的水平。但是这在很大程度上依赖于这类知识库中已被挖掘的大量标注信息和统计数据。而这样的信息在各类领域知识库中很难获取。因此现在的实体链接工作开始逐渐转向如何依赖更少的信息来完成实体链接任务。
　　除此之外，还有可能会碰到跨语言实体链接的问题，比如说知识库中的语言为英文，而待进行链接的文本却为其他语言，比如中文或者孟加拉语。也就是要链接到KG的文本并非KG中的语言。这也是现在实体链接任务所研究的重点内容。
　　本文即是在当下的研究基础上，对多语言实体链接任务在低资源条件下的解决方案进行了探究，并提出了仅依靠知识库中实体的名称和描述来解决实体链接的多语言少样本问题和多语言泛化零样本问题的方法。而且，通过构建符合这些问题设定的数据集并加以实验，最终证明了方法的有效性。

其他文献

基于Saga模型的分布式事务一致性框架的设计与实现

时间的推移、需求的不断变更和技术人员的不断更替导致应用系统的结构变得愈加复杂，将原本的单体应用拆分成分布式应用已经成为了必然趋势，事务也随之从单体事务变成了分布式事务。然而分布式事务会带来数据不一致的问题，所以研究出一个能够保证数据最终一致性的框架就显得迫在眉睫。目前开源的一些分布式事务一致性框架大多是采用中心协调者的方式。中心协调者需要控制所有分支事务的提交和回滚工作，具有严重的单点问题和堵塞问题，它的性能和可靠性直接影响到了整个业务应用的性能和可靠性，一旦中心协调者出现故障，就会使得整个业务应用无法正

学位

Saga事务模型分布式事务事务一致性框架协调者堵塞问题事件驱动架构中心分布式应用可靠性性能问题

跨越中等收入陷阱

摘要：跨越中等收入陷阱的根本在于完成产业由资本密集型重化工业向技术（知识）密集型产业升级。东部地区产业向技术（知识）密集型产业升级和中西部地区承接东部的产业转移。通过完成产业结构转移和产业升级来构建国家价值链。国家价值链可通过实现经济持续增长，促进区域协调发展，形成“橄榄型”社会和缓解城市病来促进中国跨越中等收入陷阱。　　关键词：中等收入陷阱国家价值链产业升级　　中图分类号：F061.3 文

期刊

基于深度学习的全自动虚实景融合技术

将虚拟物体自然的融合到真实照片中是计算机图形学的重要研究方向之一，传统方法通常需要用户手动标注照片中的场景几何与光源位置，在恢复出3D场景和光源的情况下进行重新渲染。巨大的交互量与重新渲染的计算量限制了该技术在实时任务下的应用。
　　本文结合深度学习技术与预计算技术，以降低交互量和提升融合速度为目标，提出了一种全自动虚实景融合算法，在开阔平面场景下，仅需单张照片，便可在特定视点下将合成物体放到平面上，整体流程无需任何手动标注与重新渲染过程，并可在30毫秒内完成融合。
　　本文算法以3阶球谐函数

学位

深度学习全自动实景渲染器照片合成物体光源阴影颜色信息学习技术算法真实感图像

面向智能移动机器人的ADAM平台及应用

随着近些年来人工智能的发展，智能移动机器人作为人工智能算法落地的载体也得到了人们的广泛关注，其作为一种复杂的机电设备，需要多种模块、算法和技术的有机融合才能真正发挥其替代劳动力的作用，然而现有智能移动机器人开发平台的局限性使得开发一个安全、实时、鲁棒的智能移动机器人应用存在着诸多困难。
　　一方面，对于机器人硬件平台，一般由计算平台、控制执行平台和传感器平台组成，其中计算平台作为控制命令的分发单元以及传感数据的处理单元，虽然目前的通用处理器在性能方面有很大的提升，但单个性能强大的处理器仍然难以满足智

学位

智能移动机器人ADAM软件平台机器人应用人工智能算法计算平台传感器安全实时控制处理器硬件平台应用开发

大规模场景中高效鲁棒的视觉定位

视觉定位是计算机视觉领域中的重要研究课题，它在自动驾驶、移动机器人和增强现实等领域中有着非常广泛的应用。近年来，随着这些领域的快速发展，关于视觉定位的研究取得很多突破，但针对大规模场景的视觉定位还面临着效率和鲁棒性两方面的挑战。一方面，随着场景规模变大，算法的计算时间和内存消耗将会变得无法接受，尤其在计算性能受限的移动设备上表现的更为严重。另一方面，在大规模场景中不可避免地存在重复结构和重复纹理的问题，这严重地降低了局部特征的判别性从而影响视觉定位的鲁棒性。因此，在大规模场景中实现高效和鲁棒的视觉定位是一

学位

大规模场景鲁棒性视觉定位定位方法特征匹配计算性能几何地图效率局部移动机器人自动驾驶

基于特征差异化学习的多模态内容点击率预估方法

近些年来，互联网应用的内容传播与表现形式越来越多样化，面对多模态信息融合载体的推荐需求，需要机器学习模型从多种维度、综合利用多种技术对多模态内容进行足够细致的分析理解。特征组合是点击率预估任务中的重要问题，基于深度神经网络的点击率预估模型利用显式的特征组合结构，同时捕捉高阶和低阶的特征组合，从而取得了优异的效果。但是这些模型只关注于对原始类别特征进行组合，没有同时考虑组合特征表达的完整性以及组合特征的重要度。认为在多模态特征的推荐场景下，完整的特征表达和有效的特征利用对模型的影响更加明显。
　　首先

学位

基于特征差异化机器学习模型多模态内容表征点击率预估模型特征组合重要度组合特征神经网络特征抽取方法

自适应3D多物体追踪

3D多物体追踪是计算机视觉中重要的问题，并且在许多重要场景比如无人驾驶、机器人等中得到了广泛的应用，因此其受到了极大的关注。然而目前大部分的工作通过提出越来越复杂的神经网络不断提高追踪的精度，但却忽略了系统的计算复杂度使得这些算法很难在实时性的系统比如自动驾驶上运用。因此，本文基于点云的数据特征提出一个简单且有效的实时追踪算法，能够基于点云的检测特点自适应调整，根据物体的类型自适应调整模型参数，最大程度上减少检测的噪声。本文采用的为基于点云的物体检测的追踪框架，使用一个现成的3D物体检测算法生成物体检测框

学位

自适应调整物体追踪追踪算法检测自适应卡尔曼滤波无人驾驶数据关联模型点云相似度计算计算机视觉计算复杂度

聚焦任务的服务机器人知识共享云平台关键技术研究

随着人工智能及信息技术的高速发展，服务机器人的智能化水平飞速提高，应用场景更加丰富，已经普遍进入并开始改变我们的生活。人们期望其可以成为能够快速准确理解用户请求、不断增长和扩展技能、能够应付复杂环境和复杂任务的智能助理。当前对于提高服务机器人的智能化水平，主要有两方面实践，一种是提高单个机器人的技术水平，常见于单一功能和应用场景的机器人中，如教学机器人、扫地机器人等，这种方式的问题是由于知识闭塞而带来的重复学习;另一种是通过统一终端来控制其他设备，例如智能家居中的智能音箱，这种方式可以通过人机交互实现多个

学位

聚焦服务机器人知识共享平台任务知识任务请求知识数据库智能化自然语言重复学习终端语言体系用户请求

基于深度学习的地震事件到时识别与震级快速估算研究

近年来，随着中国对地震预警工作的投入不断增加，地震监测网络不断完善，地震监测台站所记录的数据爆炸式增长。地震数据的飞速增加导致人工处理与分析工作越来越困难。因此，对自动化处理分析方法的需求越来越迫切。随着深度学习方法的快速发展，在地震相关研究中应用深度学习逐渐成为一种发展趋势。地震事件检测、震相到时拾取（这里将二者统称为地震事件到时识别）与震级的快速估算是在地震研究中非常重要和典型的三个任务。利用深度学习方法去解决这三个问题，会提高对地震数据处理与分析的效率，从而能大幅度节省人力成本和时间成本。
　

学位

深度学习地震事件识别震级平均绝对误差事件检测快速估算传统特征地震波形数据模型应用震相拾取学习方法

面向离散制造业的APS排程算法优化及实现

中国制造业近年来蓬勃发展，其中离散制造型企业的数量也在快速增加。离散制造因其高度复杂的加工过程给生产管理带来了许多问题，例如生产周期难确定、物料需求多变等。这些问题需要用合理有效的生产计划来解决。但目前企业计划排程的实施效果并不理想:企业资源计划管理ERP(Enterprise ResourcePlanning)中基于无限产能的计划排程模型，与实际生产情况差距大，计划执行困难;而考虑更为全面、基于多条件约束的高级计划排程APS(Advanced Planning and Scheduling)也存在着工艺

学位

离散制造业APS工艺参数优化生产计划生产数据工艺路线物料问题算法请求响应企业资源计划管理计划调整

低资源条件下的多语言实体链接技术研究

与本文相关的学术论文