蒙特卡洛交叉验证用于近红外光谱奇异样本的识别

来源 :中国科学(B辑:化学) | 被引量 : 0次 | 上传用户：soogler

【摘要】

：

奇异样本识别是建立稳健模型的基础,但大样本数据集中奇异样本的识别非常困难.基于样本在蒙特卡洛交叉验证中的统计规律提出了一种奇异样本的识别方法,即首先利用蒙特卡洛交

【作者】

：

刘智超蔡文生邵学广

【机构】

：

南开大学化学系,南开大学化学系,南开大学化学系天津300071,天津300071,天津300071

【出处】

：

中国科学(B辑:化学)

【发表日期】

：

2008年04期

【关键词】

：

红外光谱样本近红外光谱奇异样本蒙特卡洛交叉验证正常样本识别方法校正集近红外

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

奇异样本识别是建立稳健模型的基础,但大样本数据集中奇异样本的识别非常困难.基于样本在蒙特卡洛交叉验证中的统计规律提出了一种奇异样本的识别方法,即首先利用蒙特卡洛交叉验证建立一定数量的模型,然后按照预测误差平方和(PRESS)排序并统计每个样本在不同模型中的出现频次.由于奇异样本的特殊性,其出现频次将与正常样本具有显著差异.通过对4组数据进行考察,结果表明:此方法可以有效地识别近红外光谱中的奇异样本,比常用的留一法交叉验证(LOOCV)方法具有更强和更准确的识别能力. Singularity sample identification is the basis for establishing a robust model, but the identification of singular samples in large sample data sets is very difficult.Based on the statistical regularity of samples in Monte Carlo cross-validation, a method of singularity sample identification is proposed, Cross-validation to establish a certain number of models, and then ranked according to prediction error squared (PRESS) and statistics of each sample in different models of frequency of occurrence due to the particularity of singular samples, the frequency of occurrence will be significantly different from normal samples through The results of four groups of data show that this method can effectively identify strange samples in the near infrared spectrum and has stronger and more accurate identification ability than the commonly used LOOCV method.

其他文献

“濆泉”、“喷泉”考辨

文献中表示水涌起的“濆”与潠水的“喷”互有通假,但一般情况下它们音义各异,而且来源不同。水涌起的“濆”与“墳”、“瀵”具有同源关系,文献旧注多扶粉切,今应读去声;潠

期刊

濆泉郭璞注释丘一曰张揖直泉文解江赋慧琳峡中

洗手帕

今天是星期天,我学写毛笔字时,不小心把墨汁沾到手上,我连忙拿出口袋里的小手帕来擦,手帕也脏了。回到家,正好奶奶在洗衣服,我请奶奶帮忙洗手帕。 Today is Sunday. When I

期刊

“了·le”在第二语言习得中工具表学习法初探及测试分析

本文从对外汉语教学实际操作的角度出发,经过对多位学者多年来对“了”字研究成果的分析、总结,整理了“助词‘了’使用规则简表”作为工具表学习法探索和实验测试的内容。通

期刊

第二语言习得le工具表对外汉语教学外国学生句尾语法规则动态助词偏误分析鲁健骥

甘肃省人民政府关于表彰全省国土绿化先进单位和先进个人的决定

各地行政公署,各市、自治州人民政府,省政府各部门,中央在甘各单位:自五届全国人大四次会议作出《关于开展全民义务植树运动的决议》以来,我省认真落实党中央、国务院关于国

期刊

绿化先进单位国土绿化甘肃省人民政府五届全国人大省政府各部门绿化委员会乡人民政府生态环境造林绿化地区行政公署

在物理教学中如何调动学生的兴趣

兴趣是最好的老师,调动学生的学习兴趣是提高教学质量的重要举措。作为物理老师,如何调动学生的学习兴趣?从教师的人格和基本功、教学内容的设计、教学方式的改变和课外活动

期刊

兴趣教师人格基本功教学内容教学方法课外活动

Economic Performance Remained Stable in July

The Ministry of Finance of China announcedon August 21 st that the state-owned and state-controlled enterprises had combined sales ofRMB11 638 billion in the f

期刊

aloneprofitrevenueownedsectorearlierBureaurubberStable

八亿农民的化肥问题

滥用化肥及化肥质量问题至今在我国来引起足够重视。目前我国单位面积施肥量已达到世界平均量的１．６倍，既浪费资源又污染环境，且会导致癌症发病率的提高。 Abuse of chemical fert

期刊

微生物肥料单位面积癌症发病率控释肥料肥料利用率当季利用率长效肥料化肥施用解钾有机食品

中国农学会农产品贮藏加工分会第四届全国学术交流大会暨农产品加工与现代农业论坛大会召开

改革开放以来，我国的农业生产和农产品保鲜加工业取得了举世瞩目的成就，农产品保鲜加工业已成为我国农业产业链条中的重要一环。理论研究和生产现实表明，目前产后农业是我国农业

期刊

中国农学会学术交流大会农产品加工贮藏加工国家八部委食品集团食品协会北京三元蔬菜农药残留哈尔滨商业大学

慢性颈部扭伤患者与健康者的眼电图检查:病例对照研究

Background: Despite their high incidence, costs, and long lasting disability, whiplash associated disorders (WAD)- lack an identifiable objective pathology that

期刊

眼电图颈部病例对照研究眼扫视运动慢性症状相关性疾病转位中间位平滑程长

笔记本电脑新技术简介

(1)TCP技术:TCP技术是指主板自动散热技术,可根据CPU工作的快慢来自动调节散热的需要。现在还有一些新的散热方法,比如冷板技术,比传统散热方法效率提高了许多。 (2)ZV技术:

期刊

笔记本电脑数据传送率解压卡散热技术冷板视频卡性能差距芯片公司视频会议视频图像

蒙特卡洛交叉验证用于近红外光谱奇异样本的识别

与本文相关的学术论文