基于滑动窗口密度聚类的数据流偏倚采样算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:czwlivetowin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于移动计算领域的移动对象轨迹数据流的管理,最普遍采用的技术手段是采样技术,而传统的均匀采样易丢失一些关键的变化数据,造成信息丢失现象。针对这一问题,提出一种基于概率密度聚类的数据流偏倚采样算法。该算法在滑动窗口模型下,充分利用了轨迹数据流自身的分布特性,结合偏倚采样算法思想克服了均匀采样的数据丢失问题。算法首先采用基于数据存在密度的聚类技术将滑动窗口划分为强簇、弱簇和过度簇,然后针对不同的簇给予不同的采样率,进行偏倚采样,进而得到最终的数据流摘要。经过实际数据集的实验检测,证明算法较好地保证了采样质量,
其他文献
P2P系统的本质任务在于提高资源利用率和系统吞吐量,满足更多用户的数据请求。在无结构P2P中,通常分配高权重节点以较多连接,使之收到并命中更多查询,以提高搜索成功率。但高搜索
Web访问流量急剧增长,使得负载均衡设备应用越来越广泛,而当前负载均衡设备价格非常昂贵,中小企业难以承受,因此设计一种低成本的Web服务负载均衡器具有重要意义。通过分析当前主
中国城镇化发展迅速,伴随而来的城市交通状况也日益恶化,早日建成现代化的交通运输系统和交通信息管理系统成为了城市交通战略的首要任务。寻找能够正确描述交通流基本规律的交
硬件实现的速度和性能是SHA-3算法甄选的重要指标。针对SHA-3末轮5个候选算法之一的Skein算法,结合其4轮迭代结构的关键路径较短而8轮迭代结构实现所用的选择器较少的优点,采
就刻画安全的性质而言,基于非演绎信息流的安全模型较基于访问控制的安全模型更为确切和本质。在基于迹语义对非演绎信息流安全模型进行分析的基础上,基于安全进程代数给出非