【摘 要】
:
在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题。该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提
【机 构】
:
哈尔滨工业大学社会计算与信息检索研究中心
【基金项目】
:
国家重点基础研究发展计划(973计划)(2014CB340503);国家自然科学基金面上项目(61370164);国家自然科学基金重点项目(61133012)
论文部分内容阅读
在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题。该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息。该方法不依赖词表,且实验证明了相比基于词表的方法在准确率上有大幅提高。应用基于依存句法分析的文本挖掘方法,我们在微博文本上进行了饮食习惯特色分析,实现了性别、地区、时间等维度的饮食习惯特色分析并可进行交叉分析,最终用词云的方式展示了结果。
其他文献
防火玻璃框架系统是主要由防火玻璃、钢制耐火框架和防火密封材料组成,在一定时间内满足耐火稳定性和(或)隔热性要求的非承重系统,主要包括防火玻璃门、防火玻璃隔墙、防火玻
南京市某老礼堂建于民国年间,通过现状调查、检测和鉴定结果,根据目前的使用要求,确定了加固设计方案。
随着社会、经济的不断发展,广电网络公司也在自身的发展过程中不断加强经营管理,而经营管理的核心在于财务管理。财务管理始终贯穿于广电网络公司管理全过程的重要组成部分,
在众多二语习得理论中,极具影响力的则是美国著名语言学家克拉申的语言输入假说。语言输入假说是其创立的监察模式的核心部分,他试图用这一假说解释学习者怎样习得语言,这一
硫氧还蛋白(Trx)系统是体内重要的巯基氧化还原系统,能够阻止炎症反应的发生,并维持细胞氧化还原的动态平衡。硫氧还蛋白系统主要由Trx、Trx还原酶、烟酰胺腺嘌呤二核苷磷酸(NAD
通过X-射线衍射仪(XRD)对经过不同表面处理的两种不锈钢(1Cr18Ni9Ti)表面进行物相分析,采用失重法测定其在氟硼酸清洗剂中的腐蚀速度,同时借助扫描电镜及电子扫描探针观测浸
印度女作家阿兰达蒂·罗伊的写作聚焦于“权力”二字,但权势重压之处也必有反对强权的力量萌发。这种力量在《微物之神》中表现为:即便是“微物”也有其“神”性。展现了底层
随着国际竞争的加剧以及我国产业结构的调整,购重组并已成为我国烟草企业资产重组和资源重新配置的一种重要方式。经过多次并购重组,尽管我国烟草企业的竞争力有了较大提升,
一方面高校科技研发投入高速增长,另一方面高校投入绩效管理制度创新相对滞后。这一矛盾解决不好既有可能因管理过松,滋生腐败现象,造成经费浪费,又有可能因为管理失当影响研
在内地出版社纷纷对收藏版经典连环画进行重新包装打造的今天,新疆人民出版社独辟蹊径,陆续推出了一大批本土原创连环画作品,内容与时俱进,贴近农牧民生活和需求。这一现象引