【发布时间】:2018-10-16 07:48:35
【问题描述】:
我正在做 pdftotext -bbox file.pdf 并产生字级输出。 有没有办法在字符/短语/行/块级别上输出坐标?
我很想知道 poppler 或 xpdf 版本的 pdftotext 是否可以做到这一点。
【问题讨论】:
标签: text-extraction pdftotext poppler pdf-scraping xpdf
我正在做 pdftotext -bbox file.pdf 并产生字级输出。 有没有办法在字符/短语/行/块级别上输出坐标?
我很想知道 poppler 或 xpdf 版本的 pdftotext 是否可以做到这一点。
【问题讨论】:
标签: text-extraction pdftotext poppler pdf-scraping xpdf
当然,只需使用pdftotext -bbox-layout,它就会为您提供所需的结构。
【讨论】: