基于背景知识和主动学习的文本挖掘技术研究

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户:liuzujnrui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了达成好的文本分类和文本挖掘效果,往往需要使用大量的标识数据。然而数据标识不但操作复杂,而且成本昂贵。为此,在基于支持向量机的分类技术框架下,在文本分类和文本挖掘中引入未标识数据,具体的执行通过基于背景知识和基于主动学习两种方法展开。实验结果表明,基于背景知识的文本挖掘方法在基线分类器性能较强的情况下可以发挥优秀的文本挖掘性能,而基于主动学习的文本挖掘方法在一般的情况下就可以改善文本挖掘的性能指标。
其他文献
直流电压平衡策略是级联整流器控制中一个重要的组成部分。比例式脉冲补偿平衡策略是一种典型的电压平衡策略,它可以较好地实现特定工况下的直流电压平衡,但是其平衡效果会受到
文章从题材和内容上对初唐七言歌行进行了分析,初唐七言歌行虽摆脱了毫无创新的刻意模仿的阶段,但它尚未能够对以往的题材进行灵活自由的运用,难以达到融他于我而不着痕迹的
以RTWD网工作流模型为基础,提出了循环的形式化定义,包括环形路径、启用点、终止点、启用条件、终止条件、入口、出口等,并基于该定义对循环模式进行了分类。介绍循环状态空间、事件、状态转换图的概念,并举例说明了如何通过循环控制表及状态转换图实现对多重循环模式的控制。
在电力电子系统中,碳化硅(Si C)MOSFET的开关特性易受系统杂散参数的影响,表现为电磁能量脉冲形态属性的非理想特性,并进一步影响系统效率和可靠性。针对Si C MOSFET,首先分
意识形态是中苏关系中一个敏感而尖锐的课题。可以说,中苏同盟因意识形态的同一性而建立,也因意识形态的背离而分裂。因此,从意识形态的角度来研究中苏关系的时异势迁,沧海桑田,无