论文部分内容阅读
头相关传输函数(HRTF)描述了声波从声源到达双耳的滤波过程,利用HRTF对音频信号进行滤波即可重现逼真的双耳三维音频效果。HRTF与听音者的人体形态学特征(头部、躯干、耳廓等)具有高度的个性化特性,听音者使用非个性化的HRTF会导致前后混淆、上下混淆、定位不准确等问题。因此,获取适合听音者的个性化HRTF已经成为双耳三维音频领域研究和实践中日益重要的一个问题。针对现有HRTF个性化技术通过线性回归方法建立人体形态学特征和HRTF之间的映射关系不能很好的表达二者之间的复杂非线性关系的问题,本文利用神经网络建立二者之间的映射关系,实现个性化HRTF的生成;针对主成分分析(PCA)对HRTF进行降维会导致HRTF中能量成分较小的高频细节信息丢失的问题,提出共极点/零点(CPZ)模型,对HRTF进行参数化表达,并建立HRTF个性化生成方法。主要工作和成果如下:(1)使用PCA对HRTF的幅度谱进行降维,减少原始数据中的冗余,同时尽可能保留数据中存在的变化。使用相关性分析对人体形态学特征进行筛选,去除相关性较高的特征。通过径向基(RBF)神经网络建立人体形态学特征和HRTF之间的映射关系模型。客观实验表明基于RBF神经网络生成的个性化HRTF的平均谱失真比线性回归方法降低了0.53dB。主观实验表明与使用通用HRTF相比,使用本文提出的个性化建模方法预测得到的个性化HRTF的听音效果更佳,平均CMOS得分较通用HRTF高1分。(2)使用共极点/零点模型对HRTF进行参数化表达,保留HRTF中的关键的听觉线索信息(波峰和波谷),利用RBF神经网络建立人体形态学特征和CPZ模型中参数的映射关系模型,客观实验表明基于CPZ和RBF神经网络生成的个性化HRTF的谱失真比线性回归方法降低了0.74dB。主观实验表明与使用通用HRTF相比,使用本文提出的个性化建模方法预测得到的个性化HRTF的听音效果更佳,平均CMOS得分较通用HRTF高1.13分。本文提出的个性化头相关传输函数的生成方法可以实现通过人体形态学特征低成本、高效率的生成个性化头相关传输函数,在实际应用中具有良好的应用前景。