面向文档安全的纸质碎片重构方法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：luozd

【摘要】

：

将纸质文档经过破碎处理转化为纸质碎片,是保护文档信息安全最为常见一种手段。由于纸质碎片具有数量众多、相互混杂、难以区分等特点,因此,若想通过碎片的逆向运算将破碎文

【作者】

：

邢楠

【出处】

：

西安电子科技大学

【发表日期】

：

2018年01期

【关键词】

：

文档恢复文字图形化聚类分析匹配优化数字取证

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

将纸质文档经过破碎处理转化为纸质碎片,是保护文档信息安全最为常见一种手段。由于纸质碎片具有数量众多、相互混杂、难以区分等特点,因此,若想通过碎片的逆向运算将破碎文档加以恢复是极具挑战性的。特别是随着科技水平的进步,纸质文档的破碎方式已经由人工撕扯转变为碎纸机切割,这使得纸质碎片的尺寸更加细小、外形更加相像,这也让纸质碎片重构变得更加困难。虽然存在巨大困难,但由于破碎文档中通常含有十分重要或敏感的信息,若能将其恢复则意味着高价值信息的复原,这将对国家、企业或个人产生重大影响,因此纸质碎片重构的研究具有十分重大的现实意义。并且,随着信息化时代的来临,人们对于信息安全的重视程度与日俱增,纸质碎片重构由于其研究对象的特殊性以及研究目标的前沿性,它已经成为国内外科研人员关注的热点问题,其研究涉及计算机视觉、模式识别、数理统计、信号处理、数据挖掘、密码分析等多学科知识的交叉与综合。当前,面对复杂程度日益提升的纸质碎片,已有的碎片重构方法仍存在诸多不足与缺陷,距离技术实用化还存在不小的差距。为有效实现破碎文档的恢复,本文从纸质碎片重构的框架、纸质碎片的聚类、纸质碎片的匹配、碎片匹配的优化方法等多个方面对纸质碎片重构问题展开研究,其具体工作如下:(1)建立一种通用的纸质碎片重构框架。该框架根据纸质碎片的特点加以构建,首先,通过碎片获取模块,将纸质碎片转化为数字图像,并利用图像预处理方法,取得标准化的碎片;其次,通过碎片聚类模块,将相互混杂的碎片按照其来源加以分类;最后,通过碎片匹配模块,把杂乱无序的碎片重新进行排列,恢复出破碎文档的原貌。该框架结构合理、简单易行,它能够很好应对多种复杂的碎片重构情况,有效实现破碎文档的自动恢复。(2)提出一种基于文档布局的纸质碎片聚类方法。该方法充分利用纸质碎片中字符的分布特点以及文本行的相关性,准确估计出碎片的聚类数量和起点,并结合文档自身的结构布局,有效实现了纸质碎片的聚类。由于该方法深入挖掘了纸质文档的内在属性,准确掌握了碎片之间的区别与联系,因此在处理复杂的同源碎片聚类问题时取得了良好的聚类效果。(3)提出一种基于字符结构关联的纸质碎片匹配方法。该方法根据碎片中字符的结构特点,以图形化的方式对字符加以描述,并结合字符重建的规律,采用不匹配组合数量以及匹配概率和作为碎片匹配的衡量尺度,进而通过互校正匹配的方法,实现纸质碎片的匹配。该方法具有较高的准确性和良好的稳定性,它能够在一定程度上克服字体变换、文字倾斜、文字缺损等因素带来的干扰,其在实际碎片测试中取得了良好的匹配效果。(4)提出一种基于遗传策略的碎片匹配优化方法。该方法根据纸质碎片的性质,首先通过序列编码对碎片排序的形式加以转换,随后利用新颖的适应度函数引导碎片的全局搜索,并通过改进遗传操作提升搜索效率,最后采用优化运行参数的方式实现算法计算性能的改善。该方法具有较强的搜索能力以及较高的匹配准确率,可以在全局范围内有效实现碎片的匹配优化。

其他文献

基于GPU的矩阵计算并行加速方法研究

矩阵计算是许多科学计算与机器学习方法的核心组成部分,有效提升矩阵计算的性能对于开发高性能科学计算系统或大数据处理系统有着重要的意义。图形处理器(Graphic Processor

学位

图形处理器矩阵计算共轭梯度法矩阵分解随机梯度下降

中医药发展：不被“李鬼”拦路不让“李逵”折腰

近日，国家市场监督管理总局、工信部、商务部等13个部门联合召开电视电话会议，决定在全国开展联合整治“保健”市场乱象“百日行动”。根据行动方案，相关部门将严查机构假借中医

报纸

中国的区域发展与区域污染

期刊

工业废气排放量区域污染

合肥施行公交专用道管理新规

为规范公交专用道建设管理行为，保障公交车辆优先通行和运行效率，自6月1日起，合肥市正式施行《合肥市公交专用道管理暂行办法》（以下简称《暂行办法》），有效期2年，公交专用道实行分

期刊

公交专用道合肥市公交车辆优先通行

基于ANSYS的机器人多维力传感器的模拟研究

运用有限元分析软件ANSYS对机器人多维力传感器进行静力分析、模态分析和瞬态分析。从传感器弹性体的静力分析可知弹性梁的应变情况,模态分析知传感器结构的固有频率及振型,

期刊

有限元分析ANSYS多维力传感器光纤光栅

时控自动浇花系统

主要运用8051单片机作为核心控制器,编程控制电磁阀的启闭。软件构成一个精准时钟,个人可以设置定时浇花时间和浇花时间的长短。该系统实用方便,实现容易,成本低。

期刊

单片机电磁阀时钟

实施生猪政策性保险制度意义深远

最近一段时间来，猪肉价格成为社会关注的热门话题。国家统计局新近公布的经济数据显示，8月份全国猪肉价格上涨46.7%，成为影响CPI指数的最大因素；猪肉市场价格的变化，同时带动着其

报纸

关于小学数学除法教学的研读

作为小学数学学习中的重难点内容,除法是小学生普遍感到棘手的知识点,相比于小学加法、减法和乘法的简易,除法的思维模式和运用技巧大有不同,学生很容易产生混淆。针对这一情

期刊

小学数学除法教学研读

对完善我国《个人所得税法》的思考

随着中国社会经济的发展，个人所得税在调节个人收入，维护社会公平方面的重要意义将更加凸显。我国现行的《个人所得税法》存在的主要问题有：税制模式不能体现纳税人税负的公平合

期刊

个人所得税税收起征点税率税制模式税收公正

枣树扦插育苗

枣树育苗是当前发展枣树栽培的物质基础，枣树无性繁殖育苗可用根蘖法、嫁接法和扦插法，以扦插法育苗较难生根，大田直接扦插不易成活。下面介绍在全光自动喷雾条件下的嫩枝扦插育

期刊

全光自动喷雾装置扦插育苗喷雾量

面向文档安全的纸质碎片重构方法的研究

其他学术论文