【摘 要】
:
全球范围内,运用大数据推动经济发展使得数据特征维数呈几何式增加,众多领域数据的特性促使特征选择成为解决维数灾难、提高算法泛化能力的有效手段之一。同时多种类别数据的特征以组结构形式存在,基于传统方法对系数添加组结构惩罚项来实现特征选择的方法日益成熟。该文针对组Lasso(Least Absolute Shrinkage and Selection Operator)回归模型一组内所有变量同时选择或舍
论文部分内容阅读
全球范围内,运用大数据推动经济发展使得数据特征维数呈几何式增加,众多领域数据的特性促使特征选择成为解决维数灾难、提高算法泛化能力的有效手段之一。同时多种类别数据的特征以组结构形式存在,基于传统方法对系数添加组结构惩罚项来实现特征选择的方法日益成熟。该文针对组Lasso(Least Absolute Shrinkage and Selection Operator)回归模型一组内所有变量同时选择或舍弃的局限性,对重叠组Lasso与分层组Lasso进行研究。首先,考虑到特征间相互重叠的问题,引入了重叠组Lasso逻辑回归模型,根据重叠系数分解机制,将组内重叠变量分解为潜在变量,以形成新的特征向量,采用组坐标下降法求解模型参数,通过仿真实验与疾病特征基因选择实验,验证重叠组Lasso较组Lasso的优越性。其次,针对组Lasso罚向量自回归模型中特征共用时滞的缺陷,引入分层组Lasso滑动平均向量自回归模型,以达到实现系数分层稀疏的同时,捕捉时间序列特征误差项在不同时期的依存关系。并通过两段式估计以及邻近梯度下降法求解参数,通过对流层散射通信传输电平预测与脑电信号特征分类实验,证明该模型在预测和特征选择方面有一定优势,且特征更稀疏。最后,为解决加入外生变量的向量自回归模型参数空间二次增长的问题,设计了基于内外生变量的分层组Lasso罚向量自回归模型。该模型采用邻近梯度下降法求解参数,有效地刻画特征间关系,内外生变量学习不同时滞,缩减参数维度。通过大气污染物预测与脑电信号特征选择实验,证明该模型在高维时间序列的预测上可获得更低的归一化均方误差值以及更易识别多通道脑电信号特征。
其他文献
随着人类生活饮食结构的改变,肠道疾病逐渐成为威胁人类健康的一个重要疾病。许多患者都忍受着疾病的痛苦,而且传统的诊疗方法给患者带来许多不便和痛苦。传统的诊疗方法采用
DT公司作为我国著名的三大电信设备制造企业、国务院大型国有资产监督管理委员会的高新技术公司——DT科技产业集团的核心业务,是我国具有自主知识产权的第三代移动通信国际标准TD-SCDMA和第四代移动通信标准TD-SCDMA LTE的参与者、知识产权所有者和产业化的核心启动者及设备市场的领导者,是第五代移动通信国际标准和技术领导者和促进者。第五代移动无线电通信国际标准和技术的领航者和推动者。国内外无线
随着机器人相关技术的发展,同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术越来越受到学术界和工业界的重视。在视觉SLAM中,相机帧间运动过快导致跟踪失败、单目SLAM尺度不确定等问题是其发展过程中的难点。针对这些问题,本文主要研究融合特征点信息的直接法双目SLAM技术,并在此基础上设计实现了一个实时双目SLAM系统。最终在提升系统精度的
随着科技的发展与不断突破,如何找到对复杂非线性系统可靠而有效的控制算法成为迫切的需求。模糊控制技术在缓解这种需求方面扮演着重要的角色。T-S模糊系统非线性地综合许多线性时不变子系统,来逼近原非线性系统的动态特性。这在非线性系统和线性系统之间建立起一座有力的桥梁,使得非线性系统的控制问题得以借助丰富而成熟的线性系统理论来解决。在进行控制算法设计时,除了保证闭环系统的稳定性以外,也希望达到某些额外的控
近年来,随着网络技术的迅速发展,消费者阅读习惯改变、移动数字终端兴起、网上书店发展势头迅猛等原因,实体书店发展面临越来越严峻的挑战。实体书店在为群众提供基本公共文化服务、营造全民阅读文化氛围、弘扬主流价值观思想等方面发挥着重要作用。但是,我国国民人均纸质阅读量极低的现状成为阻碍书香社会目标实现的一大阻力。本文以莱芜地区最大的民营实体书店三味书屋为例,通过文献研究法总结借鉴国内外实体书店成熟的营销模
庞大的农民工队伍是国家经济建设的生力军,但由于大多数农民工文化程度较低,专业技能欠缺等原因,他们在就业过程中遇到了诸多问题。而女性农民工除了普遍性问题之外,还由于性
厦门、漳州、泉州因三地相近的地理环境、共同的闽南文化脉络以及错位发展的产业布局等,为同城化的提出与发展提供了可能性。党中央、福建省委省政府的支持,有限的资源需要有
随着移动互联网的快速发展,终端设备中的视频传输业务不断涌现。在交互式流媒体场景中,不同设备间进行着频繁的数据交互,实时性要求高,数据包的时效性对系统性能至关重要。近年来,研究人员使用信息年龄(age of information)来衡量数据包的信息时效性。信息年龄的大小定义为最新接收到的数据包从生成到当前时刻经过的时间。由于通信资源有限性和信道状态的动态变化,终端设备生成的数据包不能够及时传输到数
被动式超低能耗建筑是一种节能、环保、舒适、健康的绿色建筑。气密性及室内环境的舒适度是检验被动房的关键指标。房屋的热损失主要集中在屋顶、地面、外墙保温及窗户等关键
仿人机器人在行走和作业过程中往往会因自身或者环境因素摔倒,机器人摔倒可能导致其自身部件损坏,无法完成任务。目前国内外已经开展了仿人机器人摔倒保护的研究,其中大部分采用仿生手段对机器人进行摔倒运动规划。然而,对于仿人机器人摔倒利用手臂支撑减小损伤的情况鲜有研究。本文开展关于仿人机器人前摔保护的研究,利用摔倒检测机制判断机器人的状态,提出了仿人机器人摔倒保护策略,提出手臂着地时最佳触地点的概念,利用手