互联网话题识别与跟踪系统设计及实现

来源 :计算机工程 | 被引量 : 0次 | 上传用户:feiyelsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对互联网上论坛和新闻网站发布的海量自然语言文本,该文设计一个话题识别与跟踪系统,将海量的数据分类整理并聚合形成各个话题。该系统的核心采用SVM方法进行文本分类,基于知识库和网络流算法实现话题的聚合,测试结果表明,文章分类的正确率达到92%,聚类的正确率达到88%,具有较高的应用价值。
其他文献
近年来,比较法在英语教学中的运用越来越普遍了。所谓比较,就是将两种或两种以上的同类事物进行对比,辨别异同。这是一个通过观察、分析、归纳的方法,从而找出事物内在联系及规律
自动充电作为家庭扫地机器人不可或缺的重要一环,保证了扫地机器人可以在电量不足时,自行寻找到充电座对接充电。使用红外传感器与摄像头完成扫地机器人与充电座的对接过程中
<正> 天麻,本草纲目记载,具有平肝熄风、祛风定惊的功能,对眩晕、头痛、痉挛及抽搐等症都有一定的疗效。至于应用天麻治疗面肌痉挛,尚未见报道。1979~1985年间,我们对面肌痉挛
腐败是一直伴随人类社会发展的痼疾,我国社会的腐败问题也是尤为严峻,除了政治、经济等显性的原因外,也有一定的文化根源。中国社会由于其自身的特点产生了滋养腐败的温床,宗法制
由于砂源紧张,采用真空预压法进行地基处理时面临重大难题。为解决软基处理时用砂困难的问题,本文首先对比分析无砂垫层和有砂垫层两种真空预压法的不同之处,找出无砂垫层真
德国一家著名的钢铁公司录取员工别具一格,他们不是择优录取。而是经过笔试和体验,从体验合格和笔试成绩优秀者中录取20%左右,从成绩平平者中录取60%,成绩较差者中录取约20%
期刊