论文部分内容阅读
在互联网时代,各类的音乐网站提供了成千上万的歌曲,满足了人们对音乐的需求,为人们带来了极大的方便。但是,数字音乐的迅速发展造成了音乐信息的过载,面对海量的歌曲人们难以快速找到符合自己兴趣的音乐。音乐推荐系统的出现能够为用户推荐可能喜欢的音乐,帮助用户快速的发现或者找到自己想要的歌曲。这种推荐服务能够为用户提供良好的使用体验,带来商业利益,因此音乐推荐领域也成为工业界和学者们重视的研究方向。协同过滤算法广泛应用于各领域的推荐系统中,但是存在冷启动和可扩展性差的问题;传统的推荐算法没有考虑到音乐行为中特有的连续性行为和环境的影响,造成了推荐效果不理想。针对这些问题,本文对音乐推荐算法进行了深入的研究,对协同过滤算法进行了改进及基于大数据分析平台的并行化实现;同时,基于音乐收听的特点,实现一种音乐列表的推荐算法。首先,本文对于协同过滤算法进行了研究,针对基于ALS模型的方法进行了改进,根据用户属性信息对用户进行聚类分群,提出分群协同过滤算法。同时,对分布式计算技术进行研究,基于Spark平台实现算法的并行化设计与实现。基于Spark平台的分群协同过滤算法提高了推荐的准确性和效率,并解决用户的冷启动问题。然后,本文对于音乐收听具有连续性且与上下文环境有关的特点,实现了一种基于空间模型的音乐列表推荐算法。通过将三者之间的概率关系映射为空间距离,构建用户-歌曲-标签空间模型,实现对用户的个性化并且连续的歌曲推荐,满足用户当前音乐需求。最后,基于上述两种推荐技术本文设计了一种多功能音乐推荐系统。基于Spark分布式平台,从实际需求出发,实现对用户长期喜好预测的音乐推荐和当前会话期内需求偏好的连续列表推荐功能。