【发布时间】:2019-04-25 03:57:04
【问题描述】:
我正在尝试从表格中的 PDF 中提取数据。我可以使用 pandas 提取数据并读取数据。
最近数据发生了变化,现在我想只提取那些在 PDF 表格中带下划线的值。表结构相同。但是要提取的数据已加下划线。bi 尝试了 OCR、tessaract 来提取数据,但没有成功,因为他们提取了所有数据。但我只需要带下划线的数据。
如果有帮助,下划线始终为红色。
我使用 Python 作为编程语言。
【问题讨论】:
-
您是否尝试过查看表格?它可能会有所帮助