一种基于潜在语义结构的文本分类模型

来源 :第二届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2004) | 被引量 : 0次 | 上传用户:zhiming2692
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽量保留文档信息的同时,增加考虑了文档的类别信息,从而能从LSI模型更好地表示原始文档空间中的潜在语义结构.
其他文献
在Gleeble-1500热模拟机上对AM60镁合金在应变速率为0.0005—0.5s^-1、变形温度为250~450℃条件下的流变应力行为进行了研究。结果表明:AM60镁合金热压缩变形的流变应力受到变形
空气静压支承轴承是一类基于气体润滑技术而开发的气浮功能部件,广泛应用于各类超精密加工或测量装备,具有运动精度高、摩擦小、产生热量小等优点。在各类空气静压支承轴承中
《荀子》,已列入中华传统百部经典首批书目。为了在悬殊很大的争议中考清荀子的年龄,本文从细解《孟子·荀卿列传》入手,荀子从那里到稷下学宫?与谁一起到稷下学宫?为什么到
期刊
以膨化率为指标研究了水分、食盐和乙醇等溶液浸泡处理对微波真空膨化爆裂玉米的影响 .借助扫描电子显微镜技术对它们影响微波真空膨化爆裂玉米的机理进行了探讨 .实验证明 ,
为了提高高校思想政治理论课教学改革的成效,文章从用户思维、整合思维、平台思维和数据思维四个方面分析了互联网思维对高校思想政治理论课教学改革的启示,其中数据思维包括