【问题标题】:PDF to Text (Table format)PDF转文本(表格格式) 【发布时间】:2018-04-17 17:59:07 【问题描述】: 我在将以下 PDF 文件转换为文本时遇到问题!我是表格的第一列,但在文本中一切都搞砸了。我不能使用正则表达式,因为有时第一列的格式出现在第二列! 【问题讨论】: 标签: text ocr 【解决方案1】: 您可以在线使用简单的 OCR 工具,例如 http://www.newocr.com/。 【讨论】: 【解决方案2】: 如果您可以使用亚马逊textract 或谷歌的tesseract。两者都会很好地转换pdf。 【讨论】: