论文部分内容阅读
近年来,消费类电子产品低成本、高稳健性的语音识别片上系统的需求快速增加,语音识别系统大量地重实验室的PC平台转移到嵌入式设备中。嵌入式设备通常针对特定应用而设计,只需要对几十个词的命令进行识别,属于小词汇量语音识别系统。因此在语音识别技术的要求不在于大词汇量和连续语音识别,而在于识别的准确性与稳健性。本文鉴于此,提出了一套在基于ARM的嵌入式系统上实现语音评分的方案。它基于32位低功耗轻巧型RISC内核芯片架构,本CPU属于目前大多数嵌入式系统所采用的ARM7 TDMI内核,ARM微控制器的低功耗、高性价比、高性能适合与本篇所采用的语音评分系统。语音评分是应用于语言朗读训练时对跟读语音和参考标准读音之间接近程度的一种自动评价方法。它通过对语音数据进行分析,尽量模拟人的主观感觉对其发音和语调等方面的准确度作出相应的评价,并使得评分标准尽量达到和人工评分相一致。语音评分普遍使用音素评价方法。它是基于语音模型的评价方式,通过语音识别技术切割出每个音素单元,再对每个音素单元和模板库里的音素进行比较并求得相似度。这种方法的评分结果只反映了语音内容的正确程度,却忽视了语言朗读过程中的韵律变化特点,不仅需要对大量样本数据进行训练以建立语音模型,还需要借助较强运算能力的平台(如PC机)实现语音识别功能,运算量较大,不适合嵌入式系统。本文采用的语音评分是一种基于语音特征比较的评价方法。它通过对比参考标准语音与待评价语音,从一个比较主观的角度去评价一段语音的质量。第一章参考文献[2]和[5]指出,梅尔倒频谱参数和音调参数对语音评分的重要性较大,因此本文讨论的语音评分方法把评价的重点放在音调韵律变化的比较上。这样做可减少评分参数的数量,并在保证评分质量的基础上降低评分操作的运算量,使得评分系统能够从PC平台移植到嵌入式系统上。