论文部分内容阅读
在作曲领域,人工作曲需要掌握基础乐理、曲式、和声等专业知识,对于普通用户来说,作曲专业性和门槛太高。自动作曲可以让更多的普通用户参与到音乐制作中,提高了音乐的娱乐性。同时,自动作曲具有随机性,可以给专业人士带来创作灵感。在新理论新技术以及社会发展需求的共同驱动下,人工智能加速发展,呈现出深度学习、跨界融合等新特性。本文将音乐与深度学习进行结合,从示范音频中提取音符特征,构建神经网络模型去完成自动作曲。本文的主要工作和创新点如下:(1)特征提取部分,借鉴梅尔频率倒谱系数提取的设计流程,结合钢琴音乐信号的特点,提出基于十二平均律设计88×8)滤波器阵列来提取示范音频的音符特征。同时,用alice.XPT和对应的alice.wav音频文件来验证设计的音符特征提取方法准确性,结果表明本文的方法提取音符特征准确率高,消除静音段以及泛音对基音的影响。(2)网络模型构建部分,循环神经网络具有记忆功能,擅长处理序列数据。钢琴曲可以看成是由多个音符按照乐理规则组合成的序列,且音符之间存在某种依赖关系。自动作曲让神经网络模型去学习这些隐藏的规则,然后再预测生成音符序列。在此基础上本文设计的网络模型一共有5层,隐藏层由3层门控循环单元网络组成,通过多次实验,对网络模型中的具体参数调优处理,最后生成的钢琴曲质量达到了理想的效果。(3)自动作曲质量评价部分,本文开发一套线上试听效果评分平台,邀请音乐爱好者根据自己主观听音感觉,作出评分。线下演奏评价邀请专业人士指定5个指标,利用熵权法给每一个指标进行赋权,然后对每一首歌进行综合评价。评分结果表明本文自动创作的钢琴曲得分较高,部分作品能通过图灵测试。本文设计的线上试听评价和线下演奏评价相结合的方式,也为音乐作品的评估提供了一种新的思路。