对抗网络在语音和语言任务上的应用

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:dxcnet2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,深度神经网络极大地推进了人工智能在一些领域上的发展,包括计算机视觉、语音识别、自然语言处理等,生成式对抗网络(Generative Adversarial Network,GAN)更是成为了当前人工智能界一个热门的研究方向。GAN的核心思想来源于博弈论中的纳什均衡,它由一个生成器和一个判别器组成,通过对抗博弈的方式进行训练和学习,在图像生成等领域取得了惊艳的效果。受到生成对抗网络的启发,我们将对抗博弈的思想应用到语音和语言相关的任务上。本文围绕对抗网络在语音分离和自然语言推理两个任务上开展研究工作,具体包括:1、使用对抗网络和强化学习提升语音分离的效果针对传统的单通道语音分离神经网络,我们提出一种基于对抗网络和强化学习的分离框架。由生成式对抗网络启发而产生的对抗模块的目的是通过评估分离结果和真实目标之间的差异,使两者有一样的数据分布。同时,为了使模型分离结果偏向于期望的评价指标,并且减少训练损失(比如均方误差)和测试指标(比如:SDR,声源失真比)之间的差异,我们提出基于强化学习的未来期望方法以解决这些问题,既我们直接优化性能指标来实现这一点。该框架将对抗网络和强化学习相结合,提高了单通道语音分离的性能。2、基于对抗正则化的自然语言推理模型目前自然语言推理模型存在严重依赖词信息进行推理的现象。虽然词相关的判别信息在推理中占有重要的地位,但是推理模型更应该去关注连续文本的内在含义和语言的表达,通过整体把握句子含义进行推理,而不是仅仅根据个别词之间的对立或相似关系进行浅层推理。另外,传统有监督学习方法使得模型过分依赖于训练集的语言先验,而缺乏对语言逻辑的理解。为了显式地强调句子序列编码学习的重要性,并降低语言偏置的影响,本文提出一种基于对抗正则化的自然语言推理方法。该方法首先引入一个基于词编码的推理模型。该模型以标准推理模型中的词编码作为输入,并且只有利用语言偏置才能推理成功;再通过两个模型间的对抗训练,避免标准推理模型过多依赖语言偏置。在SNLI和Breaking-NLI两个公开的标准数据集上进行实验,该方法在SNLI数据集已有的基于句子嵌入的推理模型中达到最佳性能,在测试集上取得了 87.60%的准确率;并且在Breaking-NLI数据集上也取得了目前公开的最佳结果。
其他文献
1949年以来两岸虽然采取了不同的社会发展制度,但双方在社会经济建设方面都取得了重大成就,尤其是两岸的城市化水平都得到了大幅度的提高。两岸城市化道路各具特色,其影响因素也