【发布时间】:2018-10-04 05:22:55
【问题描述】:
我在 python 上使用 Tabula 时不断收到此错误。
我已经完成了与此相关的所有 stackoverflow 问题以及博客。
我的 JDK JRE 是最新的。
java 版本“1.8.0_161” Java(TM) SE 运行时环境 (build 1.8.0_161-b12) Java HotSpot(TM) 64 位服务器 VM(内部版本 25.161-b12,混合模式)
我的路径在环境变量中正确定义。
在 Anaconda 上运行的 Python 版本。
Python 3.6.5 |Anaconda, Inc
df = tabula.read_pdf("C:\XXXXX\PDFExtractor\Test.pdf")
我也尝试过编码。
Tabula CalledProcessError: Command '['java', '-jar', 'C:\\Users\\xxxxx\\AppData\\Local\\Continuum\\anaconda3\\lib\\site-packages\\tabula\\tabula-1.0.1-jar-with-dependencies.jar', '--pages', '1', '--guess', 'C:\\Users\\xxxxxx\\PDFExtractor\\Test.pdf']' returned non-zero exit status 2.
感谢您的帮助。
【问题讨论】:
-
状态 2 通常表示没有这样的文件或目录 (
ENOENT)。仔细检查所有文件名。 -
我重新检查了我的路径。对于依赖项以及要转换的文件,它们都是正确的。
-
java怎么样,在你的PATH中吗? -
是的。它是。我已经在这个问题上经历了 20 多个 stackoverflow 问题。完成了所有需要的事情。 :(
-
很遗憾,您的环境中没有像
strace这样的东西,因为您选择使用Windows。您必须找出问题所在的文件,如果没有您的确切环境和设置,其他任何人都无法做到这一点。
标签: python tabula pdf-extraction