一个实用的古籍印刷汉字识别系统

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:hwren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文采用Shannon理论,讨论了古籍印刷汉字识别字域地选择所受的约束,汉字特征提取的性能限度,以及如何用汉字的统计特性,进一步提高系统的识别率。在理论分析的基础上,经过大量实验研究,所完成的古籍印刷汉字识别系统对已标注过720万字的古籍录入显示了它的优越性能。 In this paper, Shannon theory is used to discuss the constraints of the choice of ancient Chinese printed word recognition domain, the performance limits of Chinese character extraction, and how to use the statistical characteristics of Chinese characters to further improve the recognition rate of the system. On the basis of theoretical analysis, after a large amount of experimental research, the ancient Chinese printed character recognition system completed shows its superior performance to the ancient books which have been marked with 7.2 million words.
其他文献
我女儿读小学六年级。语文课本第三册上有这么一句:“黄澄澄的是梨,红通通的是枣。”课本上“澄澄”的注音是dengdeng。 可我查《辞海》,发觉“澄”只有两个读音:一是cheng,
采用表面光伏谱方法,测量了应变InGaAs/GaAs单量子阱在不同温度下光伏效应.结合理论计算对样品表面光伏谱的谱峰进行了指认,分析了量子阱内子能级间的跃迁能量、强度及跃迁峰半宽随温度的变
采用S偏振光和大入射角激光束干涉测量技术,检测LSI圆片表面的芯片调平和调焦精度的方法已获得成功,在圆片上各层均能保持良好的调平调焦精度。这种检测方法的试验型,已实现了±10×
据报道,日本冲电气工业新开发了发光效率提高10倍以上的发光二极管阵列。过去开发的GaAsxP(1-x)LED)阵列,驱动电流为3mA时的每单位电流的发光强度约为5μW。这次开发的LED阵列.在发
基于阵列协方差矩阵特征分解的超分辨率测向技术,在天线阵各通道特性不一致时,其性能会急剧下降。本文提出了一种基于中频采样正交滤波技术的超分辨率测向新方法,该方法可以较好
楔紧螺纹锁紧螺母的防松原理是在螺母牙根处切成斜坡状,如图1所示,螺纹副间隙较大,螺母可以轻易旋到压住被联接零件,再用力扳动少许,螺母牙根与螺栓牙顶的楔紧作用就使螺纹副的纵
胡锦涛总书记就新时期如何保持共产党员先进性,明确提出了“六个坚持”的基本要求,并把“坚持理想信念,坚定不移地为建设中国特色社会主义而奋斗”作为六条基本要求的第一条
邢台县坚持生态效益、经济效益、社会效益并重的原则,绿化太行山,兴办绿色产业。1989年以来,投入5000多万元,其中农民投入4000多万元,占总投入的80%以上,劳动积累工3700多万
关于帐、账二字,一直有点纠缠不清。报上有文章说:“该用‘账’字的地方,不应再写作‘帐’。”但也有文章说:“‘账’字应该‘休息’。”真让人有点无所适从。 查查《简化字
摘 要:新课程标准下的高中英语新教材更加注重英美文化背景知识,英语教师若能在教学中结合教材及相关素材渗透英美文化背景知识,定能激发学生学习英语的兴趣,教师可以利用词汇教学,典故介绍,文学经典阅读,英语国家的地理、历史文化知识了解等方式,培养学生的语篇理解能力,利用英美国家的社交礼节和文化习俗知识,增强学生用英语进行跨文化交际的能力。  关键词:英美文化 高中英语教学 渗透  新课标实施后,