论文部分内容阅读
本文讨论如何使用文本上的停顿标注和重音信息生成基频曲线。基频曲线生成的基本思想是使用决策树,预测出基频均值、最小值、时长三个控制参数,以及归一化的基频模板,然后用控制参数修改基频模板,并生成基频曲线。控制参数和基频曲线模板是通过语境信息和前一音节基频预测结果预测得到的,训练过程中,在文本层面使用了只体现韵律表现形式的三个层级的韵律标注和重音标注;在声学层面只使用了对应的音节基频的有限物理参数,如基频均值、最大值及最小值等。
本文通过细致的分析,用尽可能简洁的模型预测基频曲线,用尽可能少的语境参数预测控制模型的控制参数和基频模板。