OCR影像识别-豆柴文库

OCR影像识别.doc

2024-08-23

10金币

48KB

7页

kp****93

实名认证

内容提供者

1/7

2/7

3/7

4/7

5/7

6/7

7/7

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

什么是OCR？ OCR（OpticalCharacterRecognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（IntelligentCharacterRecognition）的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。 OCR的发展历史：早在60、70年代，世界各国就开始有OCR的研究，而研究的初期，多以文字的识别方法研究为主，且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例，1960年左右开始研究OCR的基本识别理论，初期以数字为对象，直至1965至1970年之间开始有一些简单的产品，如印刷文字的邮政编码识别系统，识别邮件上的邮政编码，帮助邮局作区域分信的作业；也因此至今邮政编码一直是各国所倡导的地址书写方式。中国在OCR技术方面的研究工作起步较晚，在70年代才开始对数字、英文字母及符号的识别进行研究，70年代末开始进行汉字识别的研究，到1986年汉字识别的研究进入一个实质性的阶段，不少研究单位相继推出了中文OCR产品. 工作流程：一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。从影像到结果输出，须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正，将结果输出影像输入：欲经过OCR处理的标的物须透过光学仪器，如影像扫描仪、传真机或任何摄影器材，将影像转入计算机。科技的进步，扫描仪等的输入装置已制作的愈来愈精致，轻薄短小、品质也高，对OCR有相当大的帮助，扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。影像前处理：影像前处理是OCR系统中，须解决问题最多的一个模块，从得到一个不是黑就是白的二值化影像，或灰阶、彩色的影像，到独立出一个个的文字影像的过程，都属于影像前处理。包含了影像正规化、去除噪声、影像矫正等的影像处理，及图文分析、文字行与字分离的文件前处理。在影像处理方面，在学理及技术方面都已达成熟阶段，因此在市面上或网站上有不少可用的链接库；在文件前处理方面，则凭各家本领了；影像须先将图片、表格及文字区域分离出来，甚至可将文章的编排方向、文章的提纲及内容主体区分开，而文字的大小及文字的字体亦可如原始文件一样的判断出来。文字特征抽取：单以识别率而言，特征抽取可说是OCR的核心，用什么特征、怎么抽取，直接影响识别的好坏，也所以在OCR研究初期，特征抽取的研究报告特别的多。而特征可说是识别的筹码，简易的区分可分为两类：一为统计的特征，如文字区域内的黑/白点数比，当文字区分成好几个区域时，这一个个区域黑/白点数比之联合，就成了空间的一个数值向量，在比对时，基本的数学理论就足以应付了。而另一类特征为结构的特征，如文字影像细线化后，取得字的笔划端点、交叉点之数量及位置，或以笔划段为特征，配合特殊的比对方法，进行比对，市面上的线上手写输入软件的识别方法多以此种结构的方法为主。对比数据库：当输入文字算完特征后，不管是用统计或结构的特征，都须有一比对数据库或特征数据库来进行比对，数据库的内容应包含所有欲识别的字集文字，根据与输入文字一样的特征抽取方法所得的特征群组。对比识别：这是可充分发挥数学运算理论的一个模块，根据不同的特征特性，选用不同的数学距离函数，较有名的比对方法有，欧式空间的比对方法、松弛比对法（Relaxation）、动态程序比对法（DynamicProgramming，DP），以及类神经网络的数据库建立及比对、HMM（HiddenMarkovModel）…等著名的方法，为了使识别的结果更稳定，也有所谓的专家系统（ExpertsSystem）被提出，利用各种特征比对方法的相异互补性，使识别出的结果，其信心度特别的高。字词后处理：由于OCR的识别率并无法达到百分之百，或想加强比对的正确性及信心值，一些除错或甚至帮忙更正的功能，也成为OCR系统中必要的一个模块。字词后处理就是一例，利用比对后的识别文字与其可能的相似候选字群中，根据前后的识别文字找出最合乎逻辑的词，做更正的功能。字词数据库：为字词后处理所建立的词库。人工校正： OCR最后的关卡，在此之前，使用者可能只是拿支鼠标，跟着软件设计的节奏操作或仅是观看，而在此有

相关资料

OCR影像识别.doc

2024-08-23

48KB

一种影像信息OCR识别系统.pdf

本发明公开了一种影像信息OCR识别系统，包括设备端和客户端，所述设备端和打印胶片PrintSCU请求通过导线电性输出连接，所述客户端和服务端之间通过导线电性输入连接，所述轮询检索待识别任务和胶片影像数据之间通过导线电性输出连接。该影像信息OCR识别系统，采用新型的数据处理算法，通过设备端对X光图像进行排版，通过服务端把收下来的胶片数据归档并胶片信息保存到数据库，进一步实现对胶片影像数据的获取，通过服务端将截取出来的图像进行二值化处理，进一步框选出每个文字最小识别单元框选，对同样分格、取向、尺寸的胶片数据进

2023-06-04

644KB

OCR识别.doc

电脑。然后使用ORC识别系统进行转换，最终用WORD进行修改编辑。下面教你如何使用ORC:OCR是英文OpticalCharacterRecognition的缩写，翻译成中文就是通过光学技术对文字进行识别的意思,是自动识别技术研究和应用领域中的一个重要方面。它是一种能够将文字HYPERLINK"http://wenwen.soso.com/z/Search.e?sp=S%E8%87%AA%E5%8A%A8%E8%AF%86%E5%88%AB&ch=w.search.intlink"\t"_blank"

2024-08-22

77KB

手机ocr文字识别软件-捷速OCR文字识别.docx

手机ocr文字识别软件-捷速OCR文字识别手机ocr文字识别软件-捷速OCR文字识别最近在网上发现很多的网友推荐文字提取大师，说是能够提取图片文字。为了了解一个究竟特意搜索了下文字提取大师，原来指的是ocr文字识别软件，之所以称之为大师，是因为该软件能够在保证识别正确率的前提下识别众多的文字。捷速采用的是先进的光学识别技术，能够在短时间对文字进行多层次深入的分析，所以保证了识别率，一般识别率在98%左右。只需要做简单的校对就能达到完全一致的效果。ocr文字识别软件内置极速内核，运转速度非常快。所以软件能够

2024-03-19

37KB

OCR识别技术.docx

OCR识别技术OCR技术是光学字符识别技术的缩写(OpticalCharacterRecognition)，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。相对一般文本，通常以最终识别率、识别速度、版面理解正确率及版面还原满意度4个方面作为OCR技术的评测依据；而相对于表格及票据，通常以

2024-08-23

18KB