最优间隔分布机不均衡学习方法及其工业应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:peng23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学习样本不均衡广泛存在于故障诊断、诈骗检测、网络攻击和疾病诊断等诸多领域的模式识别任务中,其对模式分类识别精度和学习模型的泛化性能等方面具有较大的负面影响。最优间隔分布机具有基础理论严密、泛化性能好等特点,对此本文基于核修正、特征工程和深度学习等多方面的理论和方法,提出了几种面向不均衡样本学习的最优间隔分布机模型。结合工业不均衡数据特征的融合提取架构,针对回转窑烧结过程中异常工况识别精度不高的问题,基于工业现场不均衡热工数据提出了一种高精度、鲁棒和低风险的烧结工况识别方法,对本文所提方法进行了工业应用验证。本文的主要工作和创新点如下:(1)样本不均衡条件下,常规分类算法学习得到的分类面通常向少数类区域扭曲,导致少数类样本的间隔分布较小,分类模型泛化能力不佳。对此,本文通过研究最优间隔分布机(ODM)的机理,基于核修正理论,构造了一种新型的基于样本间隔的保角变换函数对ODM核函数进行修正,提出了一种新型的不均衡样本分类模型mb KMODM。通过在二维可视化数据及UCI标准数据集上对该方法的性能进行了验证,试验结果证明,本文提出的mb KMODM可以较好的缓解不均衡样本引起的分类面扭曲,在平衡不同类样本分类精度的同时确保了模型的泛化能力。(2)基于样本间隔构造分类器的核修正保角变换函数,需要预训练标准分类器,但是在不均衡样本条件下,存在预训练得到的样本间隔不能可靠反映样本的空间分布等问题。对此,本文提出了一种核空间类边缘样本提取方法,通过采用样本与边缘样本之间的相对位置来代替样本间隔作为样本空间分布的表征,以此构造了一种新型基于核空间样本分布的保角变换函数,建立了一种不均衡样本分类模型bs KMODM。通过分析UCI数据集上模型的分类对比试验结果,证明了bs KMODM模型具有较好不均衡样本分类性能。(3)鉴于核空间边缘样本提取及其他样本与边缘样本之间的相对位置计算过程较为复杂,本文提出了一种核空间异类样本距离均值的计算方法。核空间异类样本距离均值可以直接通过核矩阵计算,计算效率高,对样本空间分布的反映更为精准。基于异类样本距离均值,本文重新设计了保角变换函数的构造方法,提出了一种不均衡样本分类模型dd KMODM。通过对核空间不同区域的空间膨胀系数进行可视化分析,并和多个最新模型在UCI数据集上进行对比试验,验证了dd KMODM通过调节核空间分辨率来均衡不同类样本影响的能力,并证实了dd KMODM具有较低的计算复杂度的优势。(4)复杂工业现场不均衡原始数据的存在通常导致得到的模式特征可分性不高、样本决策边界不清晰等问题。鉴于此,本文提出了一种深度融合专家先验知识和数据隐藏信息的不均衡多变量时序数据特征提取框架。该框架充分考虑了复杂工业过程数据常见的大延迟和不同模式的数据体量不均衡的特性,主要包括数据延迟特性分析、融合专家先验知识和数据隐藏信息的模式分类特征提取及特征约减三个主要部分,并在回转窑热工数据工况特征提取任务中进行了应用验证。通过对比分析降维后的单一特征与融合特征的可分性,证明了本文提出的融合先验知识与深度信息的不均衡数据特征提取框架的优越性。(5)回转窑生产现场不同烧结工况发生的频率不一样,正常工况发生概率远高于异常工况,各种烧结工况模式的样本是不均衡的,普通分类算法对异常工况检测的准确率不高。基于论文提出的不均衡样本分类模型和不均衡数据特征提取框架,本文提出了一种基于不均衡热工信号的回转窑烧结工况高精度、鲁棒和低风险识别算法。通过真实热工数据试验及工业现场应用,验证了本文所提方法的有效性。
其他文献
在过去的20年中,世界各地的犯罪活动越来越频繁。分析这些犯罪活动的特征和模式,并确定它们之间的潜在模式和关系,对于有效预防和有效控制各类犯罪行为至关重要。随着计算机硬件、软件和信息技术的发展,越来越多的犯罪记录被及时详细地记录下来,为犯罪行为分析和研究提供了丰富的数据资源。面对大规模的犯罪行为数据,如何使用各种机器学习和人工智能技术进行有效分析以识别犯罪模式及规律、预测是目前该领域的研究热点之一。
在结构的设计和风险分析中,需要考虑与尺寸、荷载、材料性能等有关的各种不确定性的影响,可靠性分析是考虑这些不确定性的一种非常有效的技术,其主要任务是获得结构的失效概率。在可靠性分析的各种数值方法中,一阶可靠度法(FORM)是结构可靠性界非常流行的方法。然而,在求解具有高度非线性极限状态函数的高维问题时,一阶可靠度法通常会遇到不收敛或发散的情况。这一困难限制了一阶可靠度法在工程和复杂问题中的进一步应用
随着经济社会不断发展,人们对生命健康的诉求日益提高。生命活动相关的生物医学问题,如疾病早期诊断与治疗,也越来越受到人类重视,已成为现代生物医学重要发展方向。基于此,科学家们在生物医学领域进行了不断探索,并在疾病生物标志物灵敏检测和恶性肿瘤诊疗新体系构建方面取得了重要进展。其中,功能核酸作为一种具有特殊功能的核酸元件可以为生物医学研究和发展提供全新思路。纳米材料凭借其优异的物理化学性质在生物传感和肿
钛合金以其优异的耐蚀性、比强度、高温性能和生物相容性而广泛应用在航空航天、生物医疗、深海探索等领域。钛合金在两相区热加工过程中发生α相向β相转变的动态相变,导致α相体积分数减少及流变软化。在等温、非等温多道次热变形及道次间保温过程发生的相变行为,对钛合金产品最终组织和性能同样具有重要影响。目前国内外对钛合金动态相变研究仍不足,明显落后钢铁在该领域研究。本文选取典型近α型Ti-5Al-2.5Sn-0
直接焊接圆管结构凭借优美的外观和卓越的力学性能在建筑、桥梁、海洋、机械等工程结构中得到了广泛应用。但因相贯节点处杆件众多且焊接量大,导致相贯焊缝附近产生严重而复杂的应力集中现象,钢管相贯节点的疲劳裂纹通常萌生于此。热点应力法是常用的疲劳设计方法之一,该方法研究热点应力幅与疲劳寿命的相关性,然而试验发现同一热点应力幅,不同热点应力分布的相贯节点表现出明显的疲劳性能差异。本文以试验数据为基础,结合有限
Al-Mg-Si合金具有中等强度、优异的成形、抗腐蚀及焊接性能,是装备轻量化的关键结构材料,已广泛应用于轨道交通、汽车、轮船、航空航天和轻工业领域。大塑性变形能够大幅细化合金晶粒,获得超细晶甚至纳米晶组织,显著提高合金的力学性能。目前运用大塑性变形来制备Al-Mg-Si合金的研究普遍存在试样尺寸小、生产效率低、材料利用率低、成本高等难于工业化应用的技术问题。设计一条通过连续大塑性变形来制备高性能A
二维半导体因其超薄的物理尺寸、新颖的物理特性及优异的光电性能,在未来通信、信息以及光电子领域具有十分可观的应用前景,是后摩尔时代引领集成电路技术快速发展的明星材料。以过渡金属硫族化物(TMDs)为代表的二维层状半导体材料具有多样的能带结构和不同的载流子类型。由多种具有不同禁带宽度、电子亲和能、介电常数和光吸收系数等物理参数的TMDs半导体构建的异质结,不仅能够兼具单种材料的优异特性,还带来了极为丰
以中杂302为试材,将番茄穴盘苗生长发育分为5个阶段(Ⅰ:播种至出苗;Ⅱ:出苗至子叶平展;Ⅲ:子叶平展至二叶一心;Ⅳ:二叶一心至三叶一心;Ⅴ:三叶一心至四叶一心),分段设定9个营养液浓度组合,研究潮汐灌溉条件下营养液浓度分段设定对番茄穴盘苗生长发育、养分积累量及利用率的影响。结果表明:在第Ⅰ阶段,灌溉1.0×营养液,番茄穴盘苗出苗率最高,播种后第7天比清水对照提高了7.71百分点,显著高于其他处理
自噬是溶酶体降解细胞内物质的总称,其作用机制是在粗面内质网和其他一些细胞器的非核糖体附着区的双层膜上形成自噬体,从而形成自噬溶酶体,降解细胞内容物,适应细胞和某些细胞器的代谢需要。自噬在多种不同类型的细胞中均有研究,但它在骨骼肌蛋白质降解中的作用研究报道甚少,特别是在鱼类中。在细胞营养充足的条件下,自噬可以被有效地抑制,而在营养缺乏时自噬被激活。自噬与活性氧(ROS)具有显显著相关性,自噬的激活可
热带气旋是我国东南沿海地区最严重的自然灾害,每年造成巨大的经济损失和严重的人员伤亡。低矮建筑的破坏、倒塌和房屋内部构件的二次损伤是热带气旋造成的主要风致和雨致灾害。因此,加强对热带气旋活动特征和低矮建筑风致破坏机理以及风驱雨效应的研究具有重要的意义。本文统计分析了近68年的热带气旋的活动特征变化规律,并采用全尺寸现场实测、风洞试验和数值模拟相结合的方法,对热带气旋过程中近地风场特性和带挑檐低矮房屋