融合语义特征的TextRank关键词抽取方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:cultra
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
TextRank使用共现窗口代替PageRank网页超链接以判断词语关系,但共现窗口机制下的词汇图是无向图,且实际中文文本中词语与其共现窗口内的词语之间在多数情况下没有认知上的指向性链接关系,导致共现窗口机制下的词语关系与PageRank网页超链接关系存在较大差别。为此,提出一种融合语义特征的关键词抽取方法S-TextRank。在TextRank方法的基础上以依存关系代替共现窗口判断词语关系,以模拟PageRank网页指向性超链接。对不同词性词语赋予相应的权重系数,从而模拟不同性质网页的重要程度。在此基础
其他文献
对地观测遥感卫星数据传输系统采用Linux虚拟服务器集群架构传输遥感卫星数据,而该集群中承载传输任务的新旧服务器在实现断点续传的过程中由于控制信息不同步会造成数据片重复。设计一种基于分布式系统架构的遥感卫星数据处理机制DPM,采用Kafka消息队列快速存储数据包,利用代码模块使Spark Streaming精准提交消息偏移量,并通过数据传输速率与进度统计实时记录DPM运行状态信息。测试结果表明,D
Interactions between dissolved organic matter (DOM) and bacteria are central in the biogeo-chemical cycles of aquatic ecosystems;however, the relative importance of biodegradable dissolved organic carbon (BDOC) compared with other environmental variables
针对低照度环境下采集的图像存在对比度较低、细节丢失、噪声干扰等问题,提出一种基于Retinex的光照图估计改进算法,以实现低照度图像增强。计算R、G、B 3个颜色通道中的最大值,并用L_2范数对光照进行近似,运用基于相对总变差形式的改进模型对亮通道进行平滑细化及自适应Gamma校正,并利用Retinex模型进行图像增强。在MATLAB仿真平台上对不同的低照度图像进行增强处理,实验结果表明,与Ret
在知识互联的大数据环境下,初步构建的领域知识图谱可展示该领域知识的结构化信息,但实体之间隐含的潜在关系并未在图谱中得到充分表达。为解决领域知识图谱实体关系丰富和扩展问题,提出一种基于实体间关联规则分析与主题分析的关系发现方法。应用与领域实体相关的数据,通过实体间关联规则分析与实体相关数据集间主题分布相似度分析获取领域实体间潜在关系,将新发现的关系融合到初步构建的知识图谱中,实现领域知识图谱的潜在关系扩展。实验结果表明,该方法能够发现部门实体间的共性,挖掘出隐藏在领域实体间的关系,可有效地应用于领域实体间关
流量回放可为网络靶场提供逼真的流量数据并支持网络新技术验证与安全评测。面向复杂虚拟网络的交互式用户行为仿真需求,设计一种交互式流量链路的用户行为仿真架构。采用基于云平台的分布式流量仿真策略,以实现面向复杂虚拟网络用户的行为仿真多样化和可扩展加载。对交互式流量回放过程中延时修复与补偿策略进行研究,提升交互式用户行为仿真的时序逼真性。仿真实验结果表明,该仿真架构能够在保证流量时序准确性的前提下,实现交互式的大规模用户行为仿真,与传统的ITRM、Tcpreplay等方法相比,在仿真行为的多样性、规模性、逼真性上
A series of highly-hydrophobic MIL-53-Al(MIL = Materials of Institut Lavoisier) frameworks synthesized via decoration of the Al-OH groups by alkyl phosphonic acid were developed as adsorbents for removing acetone from humid gas streams.The newly prepared
吓一跳最喜欢做的事就是躲在一个角落,等路人走近,就突然钻出来吓人一跳。不然,他怎么会叫“吓一跳”呢?  有的路人吓得哇哇叫,有的吓得面部抽搐,有的吓得直接晕了过去……吓一跳对他们脸上的表情大快朵颐。那些表情对他来说,就是一顿肉味十足的大餐,吃得他满口流油。  可自从遇见红鞋子,情况就发生了变化。  事情还得从头说起。  那天,吓一跳吓晕了一个路人,吃完大餐,抹着嘴角的油水,准备离开时,突然听到了嘤
ABSTRACT Detection of SARS-CoV-2 RNA in wastewater is a promising tool for informing public health decisions during the COVID-19 pandemic. However, approaches for its analysis by use of re-verse transcription quantitative polymerase chain reaction (RT-qPC
Lake Baikal is the biggest reservoir of fresh water with unique flora and fauna; presently it is negatively affected by climate change, water warming, industrial emissions, shipping, touristic activities, and Siberian forestfires. The assessment of air po
针对单模态身份认证方法存在特征单一容易被伪造和攻破的问题,提出基于用户行为足迹的多模态特征融合隐式身份认证方法。在移动设备中采集用户使用设备时的触摸压力、触摸轨迹、加速度等传感器数据,利用特征选择技术提取触摸屏交互、移动模式、物理位置等特征并对其进行训练与融合,最终通过多模态特征融合模型实现用户身份认证。实验结果表明,该方法采用的特征级融合和决策级融合方式均获得了98%以上的认证准确率,相比单模态身份认证方法更难以被伪造和攻破,且认证准确率更高、稳定性更强。