平时在网络上下载的pdf文件常常不能直接复制里面的文本信息。在网络里搜索了这方面的解决办法,但是总是不尽如人意,后面自己总结了以下的解决方法:
【1】
暴力破解一些加密的pdf文件,突破对pdf文的操作(复制,标签,注释之类的动作)
用Advanced PDF Password Recovery 5.05软件进行暴力破解就可以了
【2】
好多的pdf文件时扫描版的,是不能直接复制其中的文字的,这时就需要用CAJViewer 7.2进行文字识别。
具体步骤是:
用CAJViewer 7.2打开无加密的pdf文件(有加密的pdf文件必须先用Advanced PDF Password Recovery 5.05进行破解),
然后选择"工具"》"选择图像" ,然后选中需要识别的文字,
然后右键选择"文字识别",过一会就会识别出所选的文字了,不过会有一些不同,识别的效果取决与pdf文件的扫描清晰度,
越清晰的pdf文件,识别效果会更好,总之识别完了之后一定要认真对比,修改识别不对的地方,在对比检查的时候也是加深映像嘛,有利而无害,何乐而不为呢!是不是?
其实说起来也就是两步,一是破解,二是文字识别。软件不一定要我说的软件,自己找有这样功能的就可以了。