论文部分内容阅读
随着时代的进步,越来越多的人开始关注互联网,互联网的发展也是随着几何的趋势向前推进。现在人们与互联网已经是密不可分,而互联网上的信息在提供给人们便利的同时也埋下了危险的种子。很多不法分子借着互联网传播非法信息、恶意软件等损害互联网用户的电脑甚至于侵害用户的个人隐私,给广大网民带来了无穷无尽的苦恼。随着斯诺登事件的爆料,互联网安全近年来备受国家和人们的重视。现在不管是国家还是各网络安全公司都在设计各种系统以防范互联网上不法分子的攻击(窃取用户隐私、公司职员泄密等)。而传统的手段,像禁止员工上外网,封堵USB接口等虽然也起到了一定的作用,但是在互联网信息发达的当今社会,封堵互联网无疑是最愚蠢的做法,而公司职员的上网行为实际上是可控的,因为公司泄密主要是通过电子邮件,HTTP上传信息的方式。所以,对公司或者说特定用户进行互联网监控是非常有实际价值的。本文主要做的是百度云下载页面的审计,为了实现这个目标,必须实现一个HTTP协议还原系统,在此系统之上就可以对还原的网页数据内容进行审计,并相应进行封堵操作。本论文另外一个工作是在该HTTP还原系统之上进行网页图片流量统计。本文主要是基于HTTP协议的内容审计做了相关研究,所以做的主要工作都是围绕HTTP协议内容,因为要实现基于流量的审计和基于内容的审计两方面的审计模块,所以要对HTTP相关协议内容和数据进行还原。由于本论文是基于实际项目需求写的,所以为了实现最后的需求,需要对HTTP协议进行还原分析,这样才能进行后面的基于HTTP协议的安全审计。本论文实现了页面反查模块即根据还原的网页内容进行审计的一种手段;而对于HTTP协议内容的流量审计,本文主要将网页中传输内容相当普遍的图片作为流量审计的研究内容,这样比较有代表性,可以扩展到视频流和文本流等。本论文所做的主要工作如下:编程实现对网络数据包的实时捕获,这样可以实时分析,对实时控制用户行为起到了显著的作用;对HTTP协议进行了详细的分析,研究了各种HTTP协议字段,为后续的数据处理提供理论依据;对IP分片重组和TCP流重组技术进行了研究并实现了相关算法;对捕获的数据包进行HTTP协议的提取与分析;实现了一个基于内容的网盘下载审查模块;实现了基于流量统计的网页图片流量统计插件。该课题在完成之后进行了测试,实现了百度云有害页面的封堵并完成了一个网页图片流量统计的分析报告。