【摘 要】
:
本文利用RSS(RDF Site Summary)作为信息的采集源和发布单位,通过改造向量空间模型算法,在ASP.NET平台以及AJAX等技术支持下,实现面向用户的、轻量级动态信息采集与发布系统
【出 处】
:
华北电力大学(北京) 华北电力大学
论文部分内容阅读
本文利用RSS(RDF Site Summary)作为信息的采集源和发布单位,通过改造向量空间模型算法,在ASP.NET平台以及AJAX等技术支持下,实现面向用户的、轻量级动态信息采集与发布系统。介绍了动态信息采集系统的概念、分类特点、采集的行为模式,指出了面向用户的采集系统已经成为信息采集的重要发展方向;分析了信息发布系统的概念、发展历史及相关技术,指出实现信息的动态采集与发布相结合是完全可能的;完成了动态信息采集发布系统的设计与实现,重点解决了动态信息采集协议、内容的选取,给出了信息解析算法的选取和改造。系统分为用户信息源管理、系统后台信息采集、系统前端个性化发布平台、信息检索等功能模块,在审计知识库管理应用中取得较好的效果。
其他文献
随着数据库技术的迅速发展及其广泛应用,在数据库中积累的数据量越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够在已有的大量数据的基础上进行科学研究、商业决
随着网络技术的发展,以数字形式存储的文本数量出现了爆炸式的增长。为有效地组织它们以满足需求,文本聚类技术应运而生。传统的文本聚类技术,首先要利用向量空间模型(VSM)将
工作流就是一系列相互衔接、自动进行的业务活动或任务,而工作流模型就是对现实世界中的业务流程的准确描述,工作流过程建模是工作流技术应用的重要环节。UML是一种通用的可视
近年来,随着多媒体技术以及网络技术的迅速发展,网络上的信息资源日益丰富,信息检索技术产生了深刻的变革。人们已经不再满足于传统的基于文本的检索,而是需要一种能对视频、
数字图像抠图技术是指把任意形状的前景物体从图像中分割出来的一种技术,如今它己经成为影视特效等多媒体制作中不可或缺的关键技术,因此该技术具有巨大的商业价值。但是,现
虚拟化技术已被广泛应用于云计算、数据中心和物理网络系统等。然而随着系统规模不断扩大、业务种类持续增长,如何保证系统稳定高效地持续运行,如何经受严酷特殊环境、无法预
近十几年来,因特网上的各种信息以呈指数级的速度增长,使得互联网用户想要快速找到其真正所需要的资料信息变得越来越困难。在海量因特网信息带来信息过载和信息迷失问题而人
电子邮件是互联网上最成功的应用之一,它已经成为人们生活工作学习中不可缺少的部分。人们在享受电子邮件提供简单快捷服务的同时,也在忍受着它的副产品所带来了的痛苦,就是
随着计算系统的资源规模不断扩展、处理能力快速增强、资源种类日益丰富、应用需求灵活多样,寻求新型的计算机理论与模式已成为未来信息技术领域面临的重大挑战。计算系统虚