预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

将图片中的文字提取出来、将PDF文件转换成word文档以及将图片中的网址和文字去掉的方法 最近这段时间,由于要编写一文档,我搜集了相关的内容。需要用到的内容在pdf文档中,因此,寻找出将pdf文件转换成word的文档或者是将pdf中的文字、图片提取出来是关键。在此,我将所用到的转换软件以及相关的要点写下来,方便有此需要的各位查阅。 将pdf转换成word文档中,我分别试用了两个软件进行转换:(1)AdobeAcrobat7.0Professional(2)(pdf输出word)绿色汉化版V3.0。 AdobeAcrobat7.0用法为,用Acrobat7.0打开pdf文件,然后打开"文件"菜单点击"另存为"然后将保存类型改为Microsoftword文档,即可将pdf转换为word文档,不过此种方法比PDF2Word3.0的转换效果差,我试验了转换几篇pdf文档,PDF2Word3.0的转换效果要比Acrobat7.0好,因此建议用PDF2Word3.0来进行转换。PDF2Word3.0下载可点击其超链接进行下载。 将pdf转换成word文档容易,但有种情况,将pdf文件转换成word文档后,在word文档种,里边的文字不能编辑,文字都是由一张张图片组成的,碰到这种情况,难道我们只能一个一个的看着图片将文字录入文档中再编辑吗?我找了几个软件来将图片中的文字,提取出来保存到word文档中,易于我们进行编辑、排版等操作。其中我试用感觉用Office2003提取图片中的文字,准确度较高。方法如下: (1)我们需要安装"MicrosoftOfficeDocumentImaging"的组件,点"开始→程序",在"MicrosoftOffice工具"里点"MicrosoftOfficeDocumentImaging"即可安装运行。 (2)打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。(3)打开MicrosoftOfficeWord2003,将刚才的屏幕截图粘贴进去;点击"文件"菜单中的"打印",在安装MicrosoftOfficeDocumentImaging组件后,系统会自动安装一个名为"MicrosoftOfficeDocumentImagingWriter"的打印机。 "MicrosoftOfficeDocumentImagingWriter"打印机,其他选项无须额外设置,点击"确定"按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。 打开刚才保存的MDI类型文件,根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择"将文本发送到Word",即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑这段文字了。 或者打开MDI文档,选择"工具"菜单,选中"将文本发送到word",然后一直按确定就可以了。完成了将图片中的文字作为文本发送到word中后,我们就可以在word中对该文档进行编辑、排版等操作了。 将图片中的文字提取出来,我试用了其他OCR文字识别软件以及用上面这种方法来操作,提取出的文字都有些错别字或者是出现其他字符等。相对来说对于,用"MicrosoftOfficeDocumentImaging"组件来提取的方法,提取出的文字正确率较高。 将图片中的网址和文字去掉的方法 可以用图象处理软件,比如PS,最好不要使用橡皮工具,会把想要的的背景色也给涂掉的,建议使用图章工具,慢工出细活,只能一点一点地修改了。 若其他朋友有更好的方法,请给予告知,大家相互学习,共同进步。