泛化误差相关论文
在机器学习中,人们期望神经网络对微小输入扰动也应有较小的输出扰动,说明网络具有较高的鲁棒性,也反映了网络具有较高的泛化能力......
核矩阵近似是提高核方法计算效率的基本方法。已有的核矩阵近似方法独立于学习问题,且用于在线核方法时每回合重新求解近似核矩阵......
在机器学习与模式识别的诸多任务中,如何真实而有效地度量两个数据样本之间的相似程度是一个极其重要的问题,并极大影响着后续识别......
高速铁路(高铁)作为适应社会进步和科技发展的产物,具有运行速度快、旅客承载量大、污染低、安全性强等特性。高速铁路的无线通信系......
在机器学习领域,当训练样本稀少时,模型容易发生过拟合现象,训练出的模型泛化能力差,因此不能满足实际需要。在很多现实场景中,获......
世界是充满联系的,这种联系通常以某种形式表现出来,从数学的形式就是一种映射关系,或者说是函数关系。在信息的时代里,这种映射关......
多标签的数据类型是比单标签的数据的应用更为广泛的数据类型。相对的,多标签数据的分类比单标签数据的分类更为复杂且耗费更高,然......
在人脸识别过程中,人脸检测是人脸识别的前提和基础,人脸检测的结果对人脸识别的精度有直接的影响。人脸检测的主要工作是从静态图......
主动学习是机器学习领域中一个重要的研究分支。主动学习研究的是如何通过有选择性的获取那些最有信息量的样本的标签,使得我们可......
卫星在轨运行期间,遥测数据表现形式通常为多维时间序列.高斯过程回归(GPR)模型可以为重要的遥测参数提供动态门限,及时发现隐藏在......
在当今的现实生活中存在着很多种微信息量的数据,如何采集这些数据中的信息并进行利用,成为了数据分析领域里一个新的研究热点。机器......
分类与回归是机器学习领域的两大重要问题.研究过程中,人们通常采用与之相关的学习算法来处理这两类问题.由于学习算法的泛化性能......
神经网络的结构学习就是要确定网络的拓扑 ,使之有较好的泛化能力 .本文考虑了确定性前向网络 ,而其训练集合是随机点集的结构学习......
神经网络集成是机器学习和神经计算重要研究领域,通过训练有限个神经网络个体,并将其结论进行适当的合成,可以极大提高学习系统的泛化......
采用3层前向神经网络描述混沌时间序列的动力学模型,给出了该网络拓扑结构的确定方法。以及使网络泛化误差达到最小为依据确定网络的......
为了提高boosting算法的学习效率,根据Boosting算法泛化误差由偏差和差异组成的思想,把Boosting算法的学习过程分为减小拟合误差和......
针对原有的随机森林算法没有区别各个单分类器之间的分类优势,对分类器的组合方案进行优化,提出一种基于最大共识的模型组合算法.......
借鉴Friedman提出的基于函数空间的梯度下降搜索的思想,提出了一种新的集成学习算法——LS-Ensem算法.该算法只要求个体函数满足一......
为了提高神经网络集成中个体网络的差异性,并减少将集成用于预测时的计算量,本文结合粒子群优化算法和个体网络的并行学习机制,提出了......
提出一种动态性神经网络集成方法,该方法针对若干不同的神经网络,采用加权最近邻技术收集它们的泛化误差信息构成性能矩阵,在此基......
多类分类是机器学习领域中的重要问题.目前普遍采用的多类分类方法:“oneversus all”(OvA)直接利用“标准”的两类分类器重复构造两类......
在泛化误差(GeneralizationError)的估计中,交叉验证(Cross—validation)是最常用的方法.基于均方误差准则下,采用生物信息数据比较了泛化......
统计机器学习的主要目的是依据训练数据集建立预测模型,用以描述给定数据的统计规律,并通过已有的模型对新数据进行预测。其中,模......
在机器学习中,泛化误差(预测误差)是用于算法性能度量最常用的指标,然而由于数据的分布未知,泛化误差不能被直接计算,实际中常常通......
间隔分布是Boosting算法的关键,现有的间隔分布泛化误差界难以计算,限制Boosting算法的发展.基于此问题,文中提出直接优化间隔分布的矩......
基于差异的半监督学习属于半监督学习和集成学习的结合,是近年来机器学习领域的研究热点.但相关的理论研究较缺乏,且都未考虑存在分布......
在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证......
为了更合理地确定岩体质量类别,将主成分分析(PCA)与随机森林(RF)算法相结合,提出一种岩体质量分类的PCA-RF模型。选取能够充分反......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
为使城市环境空气质量评价方法具有更高的准确性和鲁棒性,提出将随机森林模型引入城市环境空气质量评价中的方法。通过对随机森林......
Bagging集成通过组合不稳定的基分类器在很大程度上降低"弱"学习算法的分类误差,Out-of-bag样本是Bagging集成的自然产物。目前,Out-......
粗糙集预测旨在从决策信息系统中学习规则从而预测新样本的标签.文中利用置信度刻画规则的可信程度,从而设计基于粗糙集的置信度预......
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构......
随机森林是21世纪提出的基于分类树的算法,在处理大数据集中具有明显优势,首度将其应用在降水长期预报中。以长江中下游地区1月份......
距离度量学习(度量学习),是最常用的机器学习算法之一,它广泛应用于对象识别,人脸验证和图像检索等问题。常用的度量学习算法通常......
分析了神经网络集成泛化误差、个体神经网络泛化误差、个体神经网络差异度之间的关系,提出了一种个体神经网络主动学习方法.个体神......
该文分析了神经网络集成中成员神经网络的泛化误差、成员神经网络之间的差异度对神经网络集成泛化误差的影响,提出了一种并行学习......
Boosting是近年来流行的一种用来提高学习算法精度的方法。以AdaBoost算法为例介绍了Boosting算法,并概括了它的各种理论分析,最后......
AdaBoost是最优秀的Boosting算法之一,有着坚实的理论基础,在实践中得到了很好的推广和应用.算法能够将比随机猜测略好的弱分类器......
随着遥感技术的不断发展,如何自动、准确、快速的为遥感图像分类一直是研究热点。由于红树林遥感图像训练样本获取困难,训练样本少,给......
在传统的机器学习中,模型选择常常是直接基于某个性能度量指标的估计本身进行,没有考虑估计的方差,但是这样的忽略极有可能导致错......
传统的包外估计记录全局数据与树之间的对应关系来测算泛化误差。然而基于MapReduce机制的并行随机森林算法(MR_RF)是建立在多个互不......
Boosting算法是近年来在机器学习领域中一种流行的用来提高学习精度的算法。文中以AdaBoost算法为例来介绍Boosting的基本原理。......