【发布时间】:2020-04-02 18:21:44
【问题描述】:
我有一个包含文本、图像和表格的 PDF 文件。如何提取 3 以便它识别要提取的内容并自行执行?
【问题讨论】:
标签: python pdf extract text-extraction
我有一个包含文本、图像和表格的 PDF 文件。如何提取 3 以便它识别要提取的内容并自行执行?
【问题讨论】:
标签: python pdf extract text-extraction
Python 有一个名为 PDFMiner 的包。 请浏览其文档以进行文本提取。
这里是我要参考的地方: http://denis.papathanasiou.org/archive/2010.08.04.post.pdf
【讨论】: