【摘 要】
:
传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种
论文部分内容阅读
传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种新的基于集成学习的动态Web页面语义标注方法。给出动态Web页面语义标注流程。将Web页面转换成DOM树,识别待标注文本。选取抽取信息特征与训练Web页面特征,将含有语义信息的内容分配至概念抽象化的本体上,采用多分类器集成学习方法进行分类,区分待标注信息是属性标签还是数据元素,通过不同分类器预测结果的一致性对相应样本被准确标注的置信度进行衡量。通过训练页面中涵盖的属性标注规则集与抽取信息中的属性名称实现语义标注。实验结果表明,所提方法适于大规模动态Web页面语义标注,标注结果可靠。
其他文献
目的:探讨贝前列素钠联合西洛他唑、瑞舒伐他汀治疗老年糖尿病下肢动脉病变的临床效果。方法:随机抽样法选取2017年11月-2018年11月本院110例老年糖尿病下肢动脉病变患者。随
在水下噪声听觉属性的研究中,适当、全面的评价用语是获得准确的声音主观评价实验结论的关键。在汉语语境下进行了水下噪声听觉属性评价用语的调查研究。首先根据已有的声品质
重庆市同福场~铁厂沟气田下三叠统嘉陵江组二段储层中的裂缝是主要渗流通道.通过分析同福场~铁厂沟构造嘉二段裂缝发育的主控因素,应用构造曲率分析从构造应力场的角度对裂缝有利
详细介绍了《武汉市轨道交通机电安装工程施工管理统一用表》编制的内容及关键。该表通过专家评审,得到一致好评。近年来的应用实践证明,该表对促进工程质量管理提升有极大帮
苦苣菜是一种药食同源的植物,在我国西北、华北、东北、华中地区都有栽培。苦苣菜生长旺盛,适应性强,在田间、路旁均可生长。但苦苣菜在自然条件下具有较强的生长季节性,因而
建筑与室内的色彩设计在不同历史时期具有不同的表现形式。继承并发扬古建筑中的色彩演变所反映出来的传统色彩精神,对于当代中国建筑室内设计将产生积极的影响。
"医药分家"是行政手段、管理措施、经济目的,是为了控制医院的不合理收入。从医学角度——治病救人的需要出发,更应该强调"医药一家"。医药密切结合,有利于治病救人,有利于合
本文对OFDM系统中广泛应用的一种导频辅助的信道估计器-2×1-D维纳滤波器进行了改进,以ML信道估计代替了其中的频域滤波,并将改进的估计器与2×1-D维纳滤波器在IEEE 802.16e
随着微创技术的发展及其在泌尿外科的不断应用,出现了经脐单孔腹腔镜、经自然腔道手术、机器人辅助腹腔镜等各种新的微创手术方式。这些新方法在给患者带来术后瘢痕小或体表