面向格结构的机器学习

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：cynosure

【摘要】

：

经典的机器学习算法大都是针对特定数据类型设计的,例如,ID3算法适用于离散型数据、BP算法适用于连续型数据。而在实际的学习问题中,学习数据与学习算法不匹配的情形不可避免

【作者】

：

胡巍

【出处】

：

上海交通大学

【发表日期】

：

2009年01期

【关键词】

：

格面向结构机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

经典的机器学习算法大都是针对特定数据类型设计的,例如,ID3算法适用于离散型数据、BP算法适用于连续型数据。而在实际的学习问题中,学习数据与学习算法不匹配的情形不可避免地经常出现。通常的解决方案是通过属性转换使数据与算法的类型一致,这一模式被称为“面向算法的学习”(Algorithm Oriented Learning, AOL)。然而,实验表明AOL并不是一种有效的学习模式,一些重要的数据信息可能会在属性转换中被破坏,进而影响学习的效果。本文以基于结构的属性分类和算法分类观点,深入分析了信息在属性转换中损失的本质,并在此基础上提出了“面向结构的学习”(Structure Oriented Learning, SOL),该模式引入了具有一定结构复杂性的中间结构,并以此作为联系数据与算法的纽带——SOL要求数据和算法都转换成与中间结构一致的类型。中间结构的选择在SOL模式中是非常重要的。中间结构必须有一定的普遍性,使其能定义在大多数的属性集合上;又必须有一定的描述力,使其能对其他结构进行合理的解释。“格”正是这样一个合适的、具有一定结构复杂度的、既简单又复杂的结构。本文主题就是以“格”为中间结构的机器学习。在讨论具体的“面向格的机器学习”实例之前,本文梳理了“学习”的一般过程,提出了“机器学习机”的六元组表示,并在此基础上给出了“学习”相关概念的形式化定义。至此,本文的前半部分回答了以下三个问题,“什么是学习?”,“什么是面向结构的学习?”,“什么是面向格的学习?”。而本文的后半部分则回答了“怎样进行面向格的学习?”,这里讨论了两个“面向格的机器学习”的实例。本文讨论的第一个实例是基于格的规则归纳。本文首先提出了基于认知的带例外规则(rule with exception, RE)学习框架——CBREL,以及该框架下的CBREL-CBL算法和CBREL-ID3算法;接着,通过两种不同的方法分别将两个算法转换为SOL模式下“格”类算法,最后,本文通过大量实验比较了AOL模式与SOL模式运用于混合类型数据分类问题的学习效果。实验结果表明,“格嵌入+格算法”的分类结果明显好于“离散化+离散型算法”的分类结果,而没有表现出对“连续化+连续型算法”的优势。分析认为离散化是复杂结构向简单结构的转换,这一过程存在信息损失;连续化是简单结构向复杂结构的转换,这一过程没有信息损失。以上结论也验证了本文提出的关于信息损失原因的观点。本文讨论的第二个实例是基于半格的LDA类模型学习。LDA是应用于语料的主题模型,它将主题表示为词上的一种分布,而文档则是各种主题的随机混合。LDA类模型是LDA模型及其变形的统称。LDA类模型一般适用于未标注的语料(unannotated corpus),此时,模型的训练过程可以被看作是离散型数据上的聚类过程。本文讨论了如何在面向半格的学习模式下,将LDA类模型运用于由分析树属性(parser tree attribute)构成的标注语料(annotated corpus)。

其他文献

成批收治唇腭裂患儿的临床护理体会

2001-2004年,我院分次、成批收治唇腭裂患儿（均为“微笑列车”项目病例）共663例，行唇腭裂整复术后，所有患儿均1期治愈，治疗效果理想，现将其护理经验总结如下。

期刊

腭裂患儿唇腭裂护理体会成批临床整复术后治疗效果护理经验

湖北省FDI技术溢出效应分析

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

外商直接投资内生增长理论技术溢出效应两部门模型

全自动血红蛋白电泳与Hb—F碱变性试验在β地中海贫血中的应用及评价

目的评价全自动血红蛋白琼脂糖凝胶电泳与Hb—F碱变性试验在口地中海贫血中的应用。方法采用全自动血红蛋白琼脂糖凝胶电泳仪进行血红蛋白（Hb）电泳，测定Hb—A2及Hb-F含量，同时

期刊

血红蛋白琼脂糖凝胶电泳Hb—F碱变性试验Β地中海贫血hemoglobinagarose electrophoresis Hb-F alkli denat

从世界教育评价发展史看我国教育质量综合评价改革需解决的难题

<正>2010年《国家中长期教育改革和发展规划纲要(2010-2020年)》正式发布,文件确立了中国教育未来十年发展的总体战略、指导思想和战略目标,并且专门提出要改革教育质量评价

期刊

教育质量综合评价中小学发展史教育评价理论

尿道膀胱玻璃胶异物1例报道

2007年12月本院收治尿道膀胱玻璃胶异物1例，较为罕见，现报道如下。1临床资料患者，男，39岁，工人，尿道口注入玻璃胶异物后伴尿急、尿频、尿痛、排尿困难伴大便次数增多6个月，加重1周。

期刊

尿道膀胱玻璃异物临床资料大便次数排尿困难建筑工地尿道口

家庭投资风险防范

预测风险法:仔细计算一下家庭的收入,现金、实物资产以及金融资产,计算出自己的投资资本。注意从日常获知投资信息中,分析投资风险。 Predict risk method: Calculate your

期刊

风险防范投资者投资风险

综合镇痛护理对胃癌开腹手术患者术后疼痛及舒适度的影响

目的：探讨综合镇痛护理对胃癌开腹手术患者的影响。方法：将80例胃癌开腹手术患者随机分为观察组和对照组各40例,对照组术后给予常规护理,观察组在对照组基础上给予综合镇痛护理

期刊

综合镇痛护理胃癌开腹手术术后疼痛舒适度

吕振羽的史学致用实践及其思想

吕振羽是当代杰出的马克思主义史学家,他一生治史的最根本特点,就是为新民主主义革命事业和社会主义建设事业服务,他的史学致用实践及其思想,对中国马克思主义史学的发展,曾

期刊

吕振羽马克思主义史学家史前期中国社会研究

现代医学教学方法应用与思考

为了突出培养创新型科技人才,高校必须探索并推行创新型教育方法,突出培养学生的科学精神、创新能力和创造性思维[1]。医学作为当今发展最为迅猛的学科之一,对创新型人才的需

期刊

医学教学教学方法应用与思考PBL“三明治”教学法CBLTBL医学教育改革以学生为主体

变中探出路:媒介融合环境下实体书店的生存之道

媒介融合已是大势所趋,在图书出版产业链上,网络媒介已经介入了各个环节。作为这一产业链中的最后一环,实体书店也深受媒介融合这一大环境的影响,纷纷开始转型。文章着重分析

期刊

媒介融合实体书店转型

面向格结构的机器学习

与本文相关的学术论文