【发布时间】:2020-05-10 09:56:18
【问题描述】:
是否可以使用 python 从 pdf 中提取特定文本。
测试用例:我有一个超过10页的PDF文件,我需要提取出具体的文本和与之关联的值。例如:user:value 用户 id:value。需要提取这些值。
我能够阅读所有页面,我现在想要特定的文本
【问题讨论】:
-
这能回答你的问题吗? How to extract text from pdf in python 3.7.3
-
作为新用户,也请收下tour,阅读How to Ask。特别是,可以用是或否回答的问题通常是不好的问题。
-
您可以将 PDF 转换为 XML 或 json,然后使用 lib-xml 库或 json 库从中提取您想要的任何内容。
标签: python