网络文本主题词的提取与组织研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:jy156687
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络信息的指数爆炸给人们获取与掌控信息带来了困扰,为了挖掘海量信息中的关键因子并以恰当的方式进行组织,本文设计了网络文本主题词提取和组织算法。该算法基于多级滤噪的切分词拼接,利用特定的噪音库与滤噪策略严格控制拼接过程,在合理收录策略的挑选下,算法提取出了能够准确反映海量网络数据中关键因子的主题词串。为清晰地组织主题词,建立主题词与网络事件的有机联系,设计了新的词聚类策略对主题词提取结果进行处理,使表达同一热点的主题词合理地组织在一起,共同描述同一事件。在以实际网络文本为语料的实验中,算法表现出令人满意的性
其他文献
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词“像”的比喻义及相关比喻成分的自动识别。首先,人工
"十二五"时期我国经济社会发展将受到人口结构变迁、环保意识增强、精敏制造兴起、网络化多元发展、资源日益稀缺和全球化深入推进等六大因素的挑战
随着素质教育的深入发展,学生核心素养培育成为教育界普遍关注的议题。以核心素养培育为视角,立足于小学语文教学,在阐述小学生语文核心素养内涵的基础上,通过构建"互动"课堂
目的评价结核病患者的生存质量,探讨影响结核病患者生存质量的因素,为制定改善结核病患者生存质量的合理治疗措施提供科学依据。方法采用SF-36及自制量表(QLI—TBV1.0)和自行设计
【摘要】语文课程标准指出,要鼓励学生自由表达和有创意地表达。所以,在作文教学中,要克服“固定的教学模式”,提倡学生用自己的笔写自己的话,在作文中显示自己的个性。  【关键词】个性体验个性化作文实验策略创新思维一、探究学生作文中缺少个性化内容的原因  1.作文指导模式化。学生习作前,教师总是不厌其烦地进行审题、立意、选材、编拟提纲等几方面的详尽解说,这已经成为僵化的课堂作文指导模式。学生还没有开始写
随着教学的不断变革,出现了多种教学方式,现阶段又出现了一种新的教学模式——微课。重点介绍了微课的含义及意义,以及将微课应用到小学数学的日常教学中的方法。
目的了解广州市儿童化学污染物实际摄入情况,建立个体化的膳食污染物摄入评估模式方法膳食调查了解食谱,将食物归类,市场采集相应食物检测化学污染物,计算出PTWI值。结果城区儿童
TAT新品上市、暨南大学基因美容化妆品研究中心成立,再次使暨大美塑成为业内关注的焦点,并由此引发新一轮的深层思考。