预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于并行模板的手写体汉字串行细化算法 I.研究背景 现代信息技术的不断进步,让我们处理文本和图像数据更加高效和准确。其中手写体识别技术广泛应用于银行卡、身份证等证件的自动识别,甚至是变相密码的使用,也为图像处理的深度学习提供帮助。 而手写字符的特征提取是识别手写字符的关键步骤。因此,为了获得更好的识别效果,需要对手写字符进行光滑、细化等处理。手写体汉字串行细化也是其中重要的一个环节,可以提高字符边缘细节的识别准确度。 串行细化算法已经存在很久且成熟,可以实现对手写体汉字的细化操作。然而,由于其本质上是串行的,无法充分利用现代计算机的并行计算能力,而在大量计算时造成了极大的时空消耗。针对串行细化算法的缺陷,本论文提出了基于并行模板的手写体汉字串行细化算法。 II.研究现状和发展趋势 在手写字符识别领域,存在着许多不同的手写体汉字串行细化算法。其中,Zhang-Suen(ZS)算法和徐文关(XWG)算法广泛使用于手写字符的二值化表示中。这些算法中的ZS算法最为简单,且较为迅速,但该算法只能适用于构成字符双边三角形的八个邻点或十二个邻点的情况。而XWG算法则对较细的线条效果较好,但是计算量较大。 为了提高计算效率,近几年提出了一些基于模板的手写体汉字串行细化算法。其中,张丽荣等人提出的基于反演和区域的细化算法(RIHT)和Girdlestone等人提出的跨层次跨模板变量方法通过在计算过程中使用多个模板提高了细化速度,同时提高了细化效果。 但是,这些算法都无法充分利用现代计算机的并行计算能力,算法效率仍然较低。针对这一问题,本文提出了基于并行模板的手写体汉字串行细化算法。 III.研究方法 本文提出的基于并行模板的手写体汉字串行细化算法将细化过程分为多个阶段:模板化,原始数据依次走向模板阶段,数据存储过程,细化过程。 A.模板化 在本文中,我们采用了类似于的模板方法,减少了存储数据的数量和计算所需的内存。同时,使用多个模板并行执行,从而提高整个细化过程的效率。 B.原始数据依次走向模板阶段 将邻近模板依次应用于输入图像,计算输出,并将输出复制给下一个邻近模板处理。 C.数据存储过程 为了减少计算量,保持数据一致性,减少特殊情况或错误情况的发生,我们通过缓冲区来减少细化过程中的读写。 D.细化过程 当数据到达细化过程时,模板中的信息应用于数据中,然后选择准确的像素以供保留。 IV.研究结果及讨论 使用C++语言实现基于并行模板的手写体汉字串行细化算法,同时,使用ElasticCloudCompute,基于AmazonWebServices云服务开展了大规模的测试,其中计算性能瓶颈主要来自于计算机存储器和调度程序的运行效率。 该算法可以灵活的调整运行速度和准确度,针对不同的硬件环境进行优化,达到较高的效率,同时保持较高的准确度。与串行算法相比,本文提出的算法获得了可观的性能提升。在大规模的数据集上,平均运行速度提高了60%~80%,而且计算精度几乎没有发生改变,预处理时间也更短。 但是,本算法依然需要更多的研究来解决在大数据量下的存储和处理效率方面的问题。 V.结论 本文提出了基于并行模板的手写体汉字串行细化算法,并使用ElasticCloudCompute进行了大规模测试。该算法充分利用现代计算机的并行计算能力,有效地解决了传统串行算法的时间和空间开销的问题。与串行算法相比,本算法在大规模的数据集上提高了可观的性能和处理速度。然而,本算法的存储和处理效率仍需要更多的研究才能更好地满足实际应用需求。