【发布时间】:2018-06-16 23:34:46
【问题描述】:
我正在尝试编写一个 Python 程序,该程序能够提取嵌入在网站(例如 PDF 查看器)中的 PDF 文件。但是,我还没有找到一种可靠的方法来实现这一点。
有没有一种方法或最佳实践来识别基于 MIME 类型的 PDF?
【问题讨论】:
-
mime-type 是
application/pdf -
你好艾文。感谢您的回复。但是在这种情况下,如果内容是嵌入的,如何识别 MIME 类型?
-
还有some关于如何下载pdf的建议。您能否提供嵌入式 pdf 的示例(可能是站点链接)?
-
当然,我只是上网找了一个包含嵌入式pdf的随机网页:issuu.com/futurepublishing/docs/art274.issuu当然这里有下载链接,但这不是目的。这实际上是关于如何识别是否嵌入了 pdf。 :)
标签: python pdf mime-types