【发布时间】:2018-05-31 12:29:36
【问题描述】:
我可以使用代码从 pdf 中读取文本:
import pdfx
pdf = pdfx.PDFx("1951.pdf")
metadata = pdf.get_metadata()
reference_list = pdf.get_references()
reference_dict = pdf.get_references_as_dict()
pdf.download_pdfs("D:/")
pdf.get_text()
但是不能转成json:
pdfx -d D:/Output/ -j -o output.json pdf
SyntaxError: invalid syntax
语法:pdfx [-h] [-d OUTPUT_DIRECTORY] [-c] [-j] [-v] [-t] [-o OUTPUT_FILE] [ - 版本] pdf
【问题讨论】:
标签: python