下载

1下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 将各种格式OCR为WORD文本的方法

将各种格式OCR为WORD文本的方法

将各种格式OCR为WORD文本的方法

尾巴骨痛
2009-04-11 0人阅读 举报 0 0 暂无简介

简介:本文档为《将各种格式OCR为WORD文本的方法txt》,可适用于IT/计算机领域

各种格式文件ocr成word文件的方法你还在为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷识别效率低让你痛苦不堪有的只能识别字对表格和图形无能为力识别完了版面乱七八糟无法使用。现在好了本文针对各种情况下文字识别进行总结帮助大家掌握正确方法节省时间本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案:、PDF文件的识别:)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat专业版注意不是acrobatreader(下载http:wwwxdownscomsoftSofthtml)直接另存为rtf文件(识别整个文件)或者选择工具栏上的文字选择按钮然后选择文字区域然后复制到word等中。)文件不能直接识别的(以图片形式保存的PDF文件):安装office(下载http:wwwxdownscomsoftSofthtml)并装上office工具MicrosoftOfficeDocumentImaging(完全安装此工具)然后在打印机里面会增加MicrosoftOfficeDocumentImageWriter打印机然后将PDF文件打印到此打印机选择打印形成的文件的保存位置然后会自动形成一个MDI文件并且自动用MicrosoftOfficeDocumentImage打开此文件然后选择“工具”菜单下的“使用ocr识别文本”识别完成后在选择“工具”下的“将文本发送到word”最后将把整个PDF文件识别输出到word文件中。注意:MicrosoftOfficeDocumentImage可以非常准确的全文件识别转化中文、英文、表格但是无法将图形输出到word而是把文件中的所有图形单独形成一个个独立的图片文件放在相同位置的一个相同名称的文件夹中因此可用snagit软件将图形打开然后复制到word中。(所有的识别软件都不能很好的处理图形的识别问题MicrosoftOfficeDocumentImage的这种处理方法已经是非常好的解决这个问题了。))加密的Pdf文件:先下载解密软件(下载http:wwwxdownscomsoftSofthtml)解密后在参看),))繁体pdf文件:用)的方法识别到word后用word中的“工具”--“语言”---“中文繁简转换”、caj文件的识别:)局部文字识别:直接使用caj浏览器(下载地址http:wwwxdownscomsoftSofthtml)的ocr)全文件识别:打印到MicrosoftOfficeDocumentImageWriter打印机后面和上面的)操作一样)博硕论文全文下载:在线阅读博硕论文待可以看到最后一页后不要关闭caj浏览器到caj安装目录下cache中找到一个较大的文件拷贝到其他位置即可。然后使用)全部转化为word。、超星文件的识别:)局部文字识别:直接使用超星浏览器(下载地址http:wwwxdownscomsoftSofthtml)的ocr)全文件识别:打印到MicrosoftOfficeDocumentImageWriter打印机后面和上面的)操作一样要注意的是超星打印功能有点区别因为超星是目录和全文分开的所以打印时需要分别把目录和正文识别到word中在合并到一起。打印时要填入打印页码从到最后一页不要选择打印全部。此外在打印选项中还要将页面比例设成真实大小而不是整宽。注意:识别速度比其他格式要慢很多请保持耐心但是最后当你看到轻松的生成全本书的word版本时你会欣喜若狂的呵呵。我的试验结果是一本页的书识别需要几分钟的时间。)超星相对比较麻烦一些如果还有问题可以先把超星打印成完整的pdf文件然后在用、的方法转成word、其他情况下的识别:使用snagit软件(下载http:wwwxdownscomsoftSofthtml)将任何形式的文字可以变成图片例如使用snagit将屏幕拷贝成图片然后右键点击图片文件用microsoftOfficeDocumentImage打开图形其他和)一样。注意:其他的各种识别软件请不要在用因为要么只能识别中文要么只能识别英文要么不能识别整个文件要么不能识别屏幕拷贝图像要么识别误差很大要么不能识别表格要么需要注册要么识别速度很慢要么使用不便(和word结合不紧)这些软件包括:紫光ocr万方pdfocr尚书汉王ScanSoftPDFConverterpdfword以及各种被推荐的软件等等我都装过现在都像LJ一样删除了。只要安装了acrobat专业版snagitoffice现在你可以完美的做任何事最重要的是这几个软件很好得到。针对一些问题的补充:经过一些试验发现microsoftOfficeDocumentImage存在一些不稳定的问题例如在用caj打印到MicrosoftOfficeDocumentImageWriter打印机时发现用caj版本比较快(caj不能加升级补丁)而caj有时出现假死机。另外页面显示大时转化的识别率较高。如果页数多的文件包括超星如果有问题可以分多次转化。再次补充:、由于虚拟打印到MicrosoftOfficeDocumentImageWriter比较慢并且形成的虚拟文件很大本多页的书大约是M因此会严重影响机器的运行速度和C盘空间以及内存空间建议配置好的机器一次转化不要超过页配置差的不要超过页同时打印时在右下角系统栏中会出现打印机图你可以双击看到打印任务的进度以免以为死机了。另外转化完成后请删除c:windowstemp目录下的虚拟打印文件否则你的c盘很快会被用光。、建议如果发生打印到MicrosoftOfficeDocumentImageWriter很慢或者假死的情况可以先打印到snagit虚拟打印机会自动生成tiff文件速度比MicrosoftOfficeDocumentImageWriter快然后在snagit中选择打印机为MicrosoftOfficeDocumentImageWriter打印机(相当于再打印到MicrosoftOfficeDocumentImageWriter打印机)然后选择snagitoutputs下的printer然后选择snagitfilefinishoutput即可生成msi文件其他一样。转化完成后请删除c:windowssystemssnagit临时文件。TheEndOfXDowns'Article作者:未知来源:绿盟整理发布时间:::AbdioPDFEditors是一款PDF编辑工具能和操作word一样操作pdf文件特别信息:RegistrationName:salesacamponetRegistrationCode:MAPQRASSZJPSZJ

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/2

将各种格式OCR为WORD文本的方法

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利