论文部分内容阅读
随着人工智能的发展和计算机性能的大幅提商,人们希望机器也能像人类一样具备情感智能,以进一步消除人机交互的障碍。因此近年来,情感计算越来越受到大家的重视,所谓的情感计算就是计算机根据它能感知的信息,判别与之交互的人所处的情感状态,以便能做出最适当的反应。语音作为人类交流的重要媒介,是人与人之间传递信息的最基本途径。语音信号不仅传递着实际的语义内容,并且通过高低强弱、抑扬顿挫来表达说话人丰富的情感信息。因此,通过语音判别说话人的情感是情感计算的一个重要内容,语音情感识别也越来越受到重视。然而,如何提取语音中能够区分情感类别的特征是一个难点,针对传统语音韵律特征提取方法的会带来误差的缺点,本文提出了基于语音音节分布的韵律特征提取方法。本文的主要内容有以下几个方面:
1.分析基频、能量、语速等韵律特征的特点,研究了不同情感状态下这些韵律特征的变化。
2.提出了基于语音音节分布的韵律特征提取方法,减少因为计算语音停顿时间的韵律特征而带来的统计误差,此外利用不同情感的音节分布特点,提出了音节时长,停顿时长等特征辅助识别语音情感。
3.基于EMODB情感语音库进行的算法验证,结果表明采用本文提出的基于音节分布的特征提取算法,语音情感识别的正确率高于采用基于传统的特征提取算法。
采用本文提出的基于音节分布的特征提取算法,语音情感的识别率被实验证明了高于采用传统的特征提取算法。在未来工作中,本文将对音节界定算法进步一步改进,以优化本文提出的基于音节分布的特征提取算法。