预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于bandelet的脱机手写体汉字识别研究的中期报告 中期报告 一、研究背景和意义 随着智能化时代的到来,手写体识别技术成为一个研究热点。而对于汉字的手写体识别来说,难度更是巨大。因此,采用有效的识别算法,成为研究汉字手写体识别的重要内容。 目前,基于神经网络的识别算法得到了广泛的应用。但是,这类算法需要大量的训练数据和计算时间,并且易受到噪声的影响。 针对这种情况,本研究考虑了一种新的手写体识别算法——Bandelet算法。与基于神经网络的识别算法不同,Bandelet算法不需要大量的训练数据和特定的处理过程,具有一定的优势。 二、研究方法 1.数据集的选择 手写体识别的算法需要大量的训练数据。本研究中选择了CASIA离线手写汉字数据集,该数据集包含3,755个汉字和375,500个单字符图像数据。 2.算法的实现 本研究采用Python语言进行算法实现。在实现Bandelet算法时,需要进行多次迭代,以寻找最优化的基础函数。 3.实验分析 本研究采用10折交叉验证方法,将数据集分为10份,每次使用9份数据进行训练,1份进行测试,最终取平均结果。 评价指标采用准确率和召回率两项指标。准确率指:正确预测数量占总预测数量的比例;召回率指:正确预测数量占总实际数量的比例。 三、实验结果 通过10折交叉验证的方法,本研究得到了实验结果。在不同的基础函数和迭代次数下,准确率和召回率均有所不同。在本研究中,最优的准确率为95.23%,最优的召回率为94.66%。 通过实验分析,我们发现Bandelet算法在手写体识别中确实具有一定的优势。但是,仍然存在一些问题需要解决,比如噪声点的处理等。 四、总结 本研究采用Bandelet算法进行脱机手写体汉字识别研究,得到了初步的实验结果。目前,仍需要进一步研究和优化算法,才能更好地解决手写体识别中存在的问题。