用 提取图片中的文字 Office
用 Office 提取图片中的文字
有时我们发现某张图片上有一些文字很有用,可是却不能将文字复制下
来,真让人郁闷。其实要想把图片中的文字抠下来也不是件难事,Office
2003 就能做到。下面就说说如何利用 Office 2003 组件中的 Microsoft
Office Word 2003 和 Microsoft Office Document Imaging 提取图片中的文
字。
安装组件
因为 Microsoft Office Document Imaging 不是默认的安装选项,所以
要使用它提取图片中的文字首先得安装。
第一步:先安装 Office 2003 中的有关组件。具体方法是:使用 Office
2003 安装光盘中的“添加或删除功能,更改已安装的功能或删除指定的功
能”更新安装该组件(如图 1)。
图 1
勾选 “选择应用程序的高级自定义”(如图 2)。
?????????
1
图 2
打开 Office 工具→Microsoft Office Document Imaging,按提示选择安装
“扫描、OCR 和索引服务筛选器”和“Microsoft Office Document Image
Writer”(如图 3)。
?????????
2
图 3
接着重新启动计算机使修改生效(如图 4)。
图 4
在安装 Microsoft Office Document Imaging 组件后,Windows XP 系统会自
动安装一个名为“Microsoft Office Document Imaging Writer”的打印
机。Imaging 组件可以通过这个虚拟打印机,将图片中的信息识别并转换输出
到 Word 等文字编辑工具中的目的。
提取文字
?????????
3
运行 Word 2003,单击“插入”→“图片”→“来自文件”,插入一张带
有文字的图片,然后点击“文件”→“打印”,弹出“打印”窗口,在“打
印机”下拉列
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
中选择“Microsoft Office Document Imaging Writer”
(安装了 Microsoft Office Document Imaging 后,系统会自动添加一个名
为“Microsoft Office Document Imaging Writer”的打印机),其他选项
默认,单击“确定”按钮,弹出“另存为”对话框,设置好保存路径和文件
名后,单击“保存”,会生成一个 MDI
格式
pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载
的文档,并自动启动 Microsoft
Office Document Imaging 将其打开,单击“工具”→“使用 OCR 识别文
本”,系统开始用 OCR 对图片中的文字进行识别,识别完成后,用鼠标选中
图片中需要的文字,单击鼠标右键,在弹出的快捷菜单中选择“将文本发送
到 Word 文档”,稍等片刻,系统就会从图片中提取选定的文字,并将其发送
到一个新的 Word 文档中,你就可以在这个新文档中对提取到的文字进行编辑
了。
?????????
4
用 Office 提取图片中的文字