问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何提取出PDF图片文字

发布网友 发布时间:2022-04-23 22:28

我来回答

4个回答

热心网友 时间:2022-05-02 06:47

用Office 2003提取图片中的文字

第一步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行。

第二步 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。

第三步 打开Microsoft Office Word 2003 ,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。
“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。

打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑这段文字了。

提示:如果你不想将转换的内容输入到一个新的Word 文档中,而是希望粘贴到一个已经打开的Word 文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执行粘贴即可。
offiice2003 确实有这个功能!
自带了Document Imaging 安装office的时候选上
默认是不安装的!

还有很多OCR软件

我使用Document Imaging的时候感觉非常不错! 推荐一下

如果 公式 字母 中文 混排
任何软件都识别不全的!
用OCR就可以了.
比如Office 2003中也提供了文字识别服务,结合那个Image writer可以很方便将PDF转成WORD。
第一种方法:用SnagIt工具进行文字提取。

首先使用SnagIt的文字捕捉功能将文字提取出来。SnagIt当前版本为7.02,大小为8903KB,下载地址可以在http://www.skycn.com/soft/2290.html 找到,汉化补丁可以在http://www.skycn.com/soft/2291.html 找到。启动SnagIt,选择菜单“输入/区域”,选择菜单“工具/文字捕获”,然后我们打开要捕捉的文件窗口,按下捕捉快捷键,选定捕捉区域即可捕捉到文字。

接着用相应工具重排文字。此时我们发现提取的文字可能会有很多空格或段落错乱等现象,而且字号、字体等不合自己的心意。这时我们可以用熟悉的WPS或Word软件进行重新编排。我们以WPSOffice2003为例看看如何对付提取后文章的编排。

用WPSOffice2003打开提取文章;然后选择“工具”菜单下的“文字”/“段落重排”,这时你会看到提取文章重新进行排版;接下来选择“工具”菜单下的“文字”/“删除段首空格”命令,使得文章的每段参差不齐的行首空格被删除;再选择“工具”菜单下的“文字”/“增加段首空格”,文章变为正常的书写格式;提取文章一般都留有空段,为删除这些空段,继续选择“工具”菜单下的“文字”/“删除空段”命令,这时文章完全变为我们所要的形式;用你熟悉的界面任意编辑文章吧。

第二种方法:用屏幕截图然后让OCR软件识别。

打开带有文字的图片或电子书籍,翻到你希望提取的页面,点击键盘上的打印屏幕键(PrintScreen)进行屏幕捕获;打开Windows自带的画图工具,将刚才捕获的屏幕截图,粘贴进去,保存为一个.bmp文件;接着打开刚才保存的文件,在编辑器中进行修正,根据你所要提取的文字进行裁剪,尽量去除不要的部分;最后启动OCR软件,在OCR中打开刚才保存的修改文件,进行文字识别,然后可随心所欲进行编辑。

热心网友 时间:2022-05-02 08:21

ADOBE ACROBAT可以将PDF另存为图片格式

如果想识别文字的话只能用OCR软件了(用来识别图片)

但做起来比较麻烦,文件太多的话一个人干不了

热心网友 时间:2022-05-02 10:13

可以用PS提到啊!他能打开这个文件!

热心网友 时间:2022-05-02 12:21

1)将PDF文件的各页导出为图片
2)用OCR软件将这些图片识别为WORD文档

具体步骤可参见http://zhidao.baidu.com/question/5755640.html
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
怀孕错过了糖筛怎么办 糖筛有哪些注意事项 怀孕几个月查唐筛 蔡家沟镇慈云寺 哈佳高铁高楞站多少平方米位置在那 超威电池生产日期怎么看 超威电池寿命一般多长时间 华晨宇鸟巢四面台10w+秒罄!!火星演唱会舞台概念图震撼发布! 手机连接160wifi电脑蓝屏使用160WiFi遇到问题应该如何解决 为什么手机wifi总是刚开启,锁屏就掉了。wifi设置里的休眠模式也是永久的... 建行卡为什么不能网上转账 学校发我们的建设银行卡一定要激活吗? 我打电话查余额说输入取钱密码... 求PDF文字提取出来的方式 除脚臭最快的好方法 应该如何进行脚臭的根治? 批量提取PDF图片文字软件 怎么清除脚臭? 怎么将PDF文件页面批量提取出来 如何批量提取pdf文件名到excel? 喝咖啡会产生色素沉淀吗? 咖啡色胎记是怎么样形成的? 咖啡喝多了,会不会黑色素沉淀? 喝咖啡会黑色素沉淀吗 咖啡斑和色素沉着有什么区别 喝咖啡对身体有益吗?经常饮用是否会引起色素沉着,脸上长斑呢? 一直传言喝咖啡和茶,酱油会使皮肤黑色素沉着 到底是不是真的? 经常喝咖啡会导致脸上未褪的痘印色素沉淀吗 经常喝黑咖啡会有色素沉着吗? 每天喝咖啡会不会容易让皮肤产生色素沉积? 中国运动员在奥运会上一共得了多少枚金牌? 长期喝咖啡会让牙齿变黄吗? 奥运会中国拿了多少块金牌? 手摇机械计算机 是通过什么原理进行计算的? 康熙时代用的手摇计算机原理 怎么提取PDF里的文字跟图片 计算机的工作原理??? 手摇计算机。详细原理。 怎样可以有效的治脚臭? 关于计算器的工作原理 怎样治脚臭最有效 手摇计算机的历史 世界上第一台手摇计算机是哪个国家哪位科学家制造的? 机械式计算器的发展和工作原理 手摇式计算机是什么样的? 手摇式计算机如何使用 计算机的工作原理是什麽? 计算机的工作原理是什么?简述! 是谁发明电脑的? 手摇式发电原理 有人知道一本攻为王爷受为暗卫,重生宠受,受被赐名为负雨的耽美小说吗?书名叫什么? 帮忙起一个好听的女生QQ昵称 桌面工具栏怎么还原?跑到右边变成竖得了!