句子级的对话情感分析研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:same66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话文本情感分析研究是自然语言处理的一个研究方向,该任务通过计算文本中蕴含的情感特征,得出文本中蕴含的情感倾向。区别于传统情感计算任务,对话文本存在信息的交互,需在分析用户情感倾向的基础上,研究用户之间情感的变化与影响,存在较多技术难点。本课题基于对话文本构建了情感分类模型,实现交互式文本的情感分类任务,主要完成以下四点工作内容:(1)提出了字符级OOV解决方案,该方案在文本预处理阶段解决了未登录词对构建语料词表的影响。本课题从语料分析和文本向量化角度进行输入语料的处理,构建俚语替换词表、表情替换表、语料词汇表等辅助词表,使用字符级OOV解决方案对文本进行细粒度切分,保留语料的原始信息。并利用word2vec模型对词向量与表情向量进行领域训练,得到适应本课题的向量化文本表示。(2)提出了多维度特征提取模型(Multi-Dimensional Feature Extraction Model,MDFE模型),实现时间维度与空间维度的对话文本情感特征提取。MDFE模型引入注意力机制,在时间维度模拟对话文本生成过程,捕捉用户交流过程中的情感变化;在空间维度利用卷积操作提取文本的结构特征,并借鉴注意力打分机制对时间、空间维度的特征进行筛选,实现多维度情感特征融合。(3)提出了层级化多情感分类模型(Hierarchical Multi-Class Classification Model,HMCC模型),完成了对话文本的情感类别预测。HMCC模型构建了“二分类->多分类”的层级化分类体系,解决数据分布不均造成的模型过拟合问题。创新地提出融合损失函数(Fusion Multi-Class Loss Function,FMC 损失),改进多分类模型的损失计算方法,从而提升分类模型的类别判断结果与计算效率。(4)结合上述三种模型,设计并实现了对话文本情感分类系统。该系统包括文本预处理、情感特征提取、情感类别判断三个模块,实现对话文本情感分类的功能;搭建了可视化系统界面,实现对话文本情感分类系统与用户的信息交流,直观的展示了本系统的功能。
其他文献
随着水下探测技术的发展,水下潜器的减振降噪处理显得尤为重要。而对水下潜器噪声性能的研究,很多是通过使用水下潜器缩比模型进行相关的实验来实现的。本文中的缩比模型水下定位与通信遥控系统就是为了保障大比例缩比模型水下实验的安全进行而设计的,它主要涉及到水下定位技术、水下目标姿态测量技术与水声通信技术。水下定位技术是在海底勘测、资源开发、军事对抗等领域广泛使用的一种声学测量技术,此技术可以用来探测水中未知
作为云计算的基本特征,动态可扩展性使云系统能够根据用户在运行时的需求动态扩展或缩小资源,这是降低云服务商的成本并提高用户交互效率的关键。目前仍然缺乏有效的方法来定量衡量云计算系统的性能和成本,并完成系统整体配置参数的优化,使得有效预测和优化云计算平台的成本和性能已成为云计算领域的关键研究挑战之一。在本文中,为了定量预测云计算平台的成本和性能,我们提出了两种模型,一种是考虑虚拟机的热/冷启动和热/冷
高硫铝土矿拜耳溶出过程中硫主要以S2-的形态转入铝酸钠溶液,并部分氧化成高价态,其中低价硫S2-和S_2O_32-对设备材质造成较为严重的腐蚀。课题组已对溶出管道材质20Cr、罐体材质Q235和16Mn钢进行了腐蚀研究,为了扩大材质的选择范围,本文以热换器常用钢种12Cr1MoV为研究对象,结合浸泡腐蚀与电化学测试方法,研究铝酸钠溶液中S2-和S_2O_32-对其腐蚀行为的影响,并分析腐蚀机理。主
近年来,由于常规油气产量逐渐下降,具有较大潜力的非常规油气资源则越来越受重视。致密油储层孔隙结构表征是对致密油储层研究的基础。本文在充分调研国内外关于致密油储层岩石微观孔隙结构研究方法的基础上,以长岭凹陷泉四段致密油储层为研究对象,主要研究了致密油储层孔隙结构表征以及流体赋存状态两部分内容。针对研究区致密油储层孔隙结构复杂,物性相关性较差的特征,首先,利用铸体薄片、扫描电镜镜下观察等方法,确定长岭
密集烤房是烟叶烘烤的重要载体,烘烤控制是获得优质干烟叶的重要途径。现阶段国内烟叶烘烤技术虽然有了很大改进,但仍存在不少问题。使用煤、生物质等作为主要燃料,造成资源浪费、产生有害气体污染环境,而且还导致烘烤过程可控性差;采用空气外排的除湿方式使得装烟室中的热量以及烟叶烘烤过程中析出的物质都被直接排出,不仅降低了烟叶评吸质量和外观色度,还增加了能耗。现有烤房控制系统和烘烤工艺主要是针对燃煤型密集烤房研
气动光学成像偏移是影响精确制导武器装备发展的重要因素之一,机载计算机能够快速获得当前状态的气动光学成像偏移数值,对提高命中率有直接的应用价值。针对风洞实验和数值模拟计算成本高、实施周期长、代价大的问题,本文研究基于改进优化算法的数据预测模型,对实际工程中气动光学成像偏移进行快速计算。首先,以极限学习机算法(Extreme Learning Machine,ELM)为基础,针对随机给定ELM初始权值
随着科技的快速发展,我国的汽车保有量不断增加,车辆在给生活带来极大便利的同时,也对交通管理提出了严峻的考验。人工智能技术的崛起使得智能化交通系统和无人驾驶汽车的概念迅速进入了社会的视野,而这些应用需要对交通图像进行场景理解。相关算法要在能够部署到有限计算资源设备的同时,需具备高精度和高效率的处理性能。针对这些问题,本文展开了面向交通图像场景理解的深度学习算法研究,本文主要研究和创新点具体如下:(1
困境儿童作为儿童当中的弱势群体,其生存发展需要社会各界的广泛关注。学业自我效能感是学生对自己学习自信程度的衡量,影响着困境儿童所获得的学业成就,关乎困境儿童的健康成长。本次实务中社工依托山西省太原市易源公益组织·彩虹圆梦坊困境儿童保护计划项目,运用参与观察法与行动研究法针对彩虹圆梦坊困境儿童学业自我效能感偏低问题进行社会工作干预,目的是提升困境儿童自我效能感,同时探讨小组工作介入困境儿童学业自我效
2008-2009年的金融危机对全球企业造成了重创,究其原因在于企业缺乏一定的流动性导致资金链断裂。金融危机后,企业加强了对流动性的关注,流动性管理成为理论界和实务界关注的
社会的发展会逐渐暴露出一些缺陷,往往给现有的社会制度带来新的挑战,孤儿作品就是其中之一,孤儿作品(Orphan Works)指由于享有著作权的人信息不明,或者即使信息清楚,仍处于著作权保护期内但作者却下落不明的作品,孤儿作品问题对世界范围内的版权制度提出了新的挑战。随着数字技术的爆炸式发展,著作权保护时间的不断延长,人们对知识产权的意识不断的提高,使得传统印刷时代的许多隐性版权问题逐渐扩大,出现了