论文部分内容阅读
手写签名识别(Handwritten Signature Verincation)是利用人们的行为特征来进行身份认证的一种生物识别技术,而为了获得丰富的签名特征,我们普遍采用的是联机手写签名识别技术。它通过专用的手写输入设备来采集手写签名的字形、压力和时间分布等特征,进而通过相应的算法对签名的外部特征如字形和内部特征压力、速度和时间分布等进行比对,以实时的鉴别签名的真伪。 签名识别中的数学模型 从数学的角度来看,一个手写签名本质上是一个以时间t为自变量,关于点的横坐标x,纵坐标y,压力z的向量函数。 通常该函数是一个分段函数,不妨设参数t的变化区间为那么此函数的表达式可以写成: 一般说来,待识签名G(t)与样本签名F(t)的时长不同,采样点数也不同,因此定义变换D,使得这里的变换D也就是在联机手写签名识别中所常用的时间归一变定义二签名之间的距离为:-一2 、、|11孑/ 于‘ d引{F(,)一‘(;)}}:(3)/了!||‘ 一一 ‘加矛 G F 了..、 ﹃+l 闷U于是签名识别问题就归结为判断不等式dif(F,G)<:。(’)是否成立的问题。其中,:。>是与F有关的误差闭值。基于稳定性分析的权函数设计 权函数的设计是降低误拒率的关键,合理的权函数能够细致刻画签名者的签名习惯特征,使识别过程着重比对样本签名中隐含的签名习惯特征,减少不稳定因素造成的不利影响。问题归结为设计体现签名者习惯特征的权函数p(‘)。使用户(‘)来对签名距离公式(3)进行修正。改进后的距离公式应为: Idif(一)二:J·(犷)!}·(/)一台(/,}{:d/)牙(5) 从数学的观点来看,签名信息中稳定性高的部分受不稳定因素影响较小,能够代表签名者的习惯特征,在设计权函数时应赋予较高的权值;稳定性低的部分受不稳定因素影响较大,设计权函数时应赋予较低的权值。 稳定性的度量即稳定度,可以根据签名的变动幅度与每一笔段的变动幅度之比来定义。第i个笔段的稳定度定义为:=1,2,L,n第i笔段上的权重为:、(犷)一八一g(s(‘)),‘。Q,,‘一‘,…,n给出两种最常用的权函数定义: C,.、1)P又f)=Pi==不,一一-一一‘又小t任‘2,,‘=1,一,n 艺s(‘)“‘, I=l2)尸(了)==八=艺(:“,一‘)“右s(i),‘任。,,i=1,一n基于优先级值的少量样本聚类方法 在熟练签名者的样本库中,我们发现同一个签名者的签名往往可以分成几种类型,类型之间的签名差别较大,而同一类型中的签名则比较相近。如果直接对样本库中的全部样本计算权函数,就无法细致刻画签名者的不同习惯特征。因此有必要依据样本间的距离应用聚类方法先将样本库中的签名样本分成若干个簇。 3算法:在相异度矩阵中找到没有标记“已处理”的最小元素min;若找不到则结束。2.检验此元素min所对应的两个样本i,j是否已经属于某个簇,此时有三种情况: 勺i,j都不属于任何己有的簇;转3. 匀i,j都各自属于不同的簇;转4. 句i,j有一个属于某个簇(不妨设为i),另一个不属于任何簇 (不妨设为j);转5.3.将i,j组成一个新的簇,并将i,j都标为“已分类”;转6.4.计算i所在类的聚类中心与j所在聚类中心之间距离,若小于闭值凡则合并两个簇;计算i与j所在聚类中心之间距离,若小于闭值凡则将i加入j所在的簇中;计算j与i所在聚类中心之间距离,若小于闭值:。则将j加入i所在的簇中;转6.5.计算i所在簇的聚类中心与j之间的距离,若小于闭值几,则将j加入i所在的簇中;否则将i,j组成一个新的簇,并将j标为“已分类”;转6.6.将m如标记为“己处理”;转1.其中ea,凡为根据经验给定的闭值,:。>几>o。基于优先级值的样本库的优化与更新 由于签名习惯特征具有随时间变化的漂移性,需要对签名人的签名习惯特征进行稳定性跟踪。不断将识别为真的签名更新到样本库中,剔 4除优先级最低的样本以及雷同样本。根据更新后的样本库调整聚类,计算更贴近签名者当前习惯的权函数。这在本质上是一个依据样本变化特点采取主动方式动态寻找签名习惯特征的过程。下面给出优先级值的定义:样本凡的优先级值a(几)一艺乃,。,dif(:,月)>“2‘,b一“一,:<d‘f(式,月)‘b一“:b>是由经验确定的常数。‘l.lt 一一 乃 中 其(尽实质是月对Fi贡献的那部分优先级值,若“ir(凡动、。,二者不、目、以,故令”Z二。;若di‘(月,月)、。,贝。“i‘(月,月)越刁、大)说明尽越 手写签名识别系统将输入的签名识别为真实签名的时候,需要对样本库进行更新。这时有两种情况: 第一种,输入