论文部分内容阅读
近年来,自闭症谱系障碍患病率呈现逐年上升趋势,研究人员结合深度学习方法在自闭症谱系障碍的预测中取得了很好的效果。论文围绕自闭症谱系障碍预测问题,研究了不均衡眼动数据的处理方法和三种不同的自闭症谱系障碍预测框架。论文完成的主要工作如下:(1)基于SMOTE和Borderline-SMOTE,提出合成过采样技术,对样本数据进行扩增和区分。基于代价敏感的思想,改进模型代价函数,对合成过采样技术区分出的数据给予不同的代价惩罚因子,使得模型适用于不均衡数据。(2)基于双路径网络,提出用于自闭症谱系障碍预测的简单,高度模块化的框架。利用残差路径和密集连接路径,对眼动数据各层次特征进行重用并探索新特征。通过替换激活函数、调整激活层与批量归一化层的顺序改善分类性能。(3)基于简单循环单元和高阶循环神经网络,提出高阶简单循环神经网络。借鉴简单循环单元的思想减少隐藏状态的依赖,增加网络的并行化能力。基于高阶循环神经网络,添加更多的记忆单元,增加网络的特征提取能力,提升模型分类准确率。(4)基于改进的双路径网络和高阶简单循环神经网络,提出用于自闭症谱系障碍预测的可靠的、模块化的循环神经网络。利用双路径网络提取眼动数据中的坐标关联性,借助高阶简单循环神经网络提取眼动数据中的时序性,并通过模型融合增强网络产生新特征的能力。实验结果显示,在双路径网络实验中,改进的代价函数使得模型AUC值提升了 11.79%,替换ReLU激活函数为SELU激活函数使得分类准确率从87.97%提升到89.49%,调整激活层和批量归一化层的顺序使得模型分类准确率进一步提升到90.88%。高阶简单循环神经网络相比于LSTM网络,训练时间缩短了 29.94%,分类准确率从88.68%提升到92.47%,基于循环神经网络的自闭症谱系障碍框架分类准确率则高达93.65%。