【发布时间】:2015-07-07 17:05:07
【问题描述】:
我需要从这个页面收集 PDF 文件:http://www.anp.gov.br/?id=532。
当我在 HTML 源代码中找不到链接时,我想知道这在 Python 中是如何实现的。在我使用 Beautifulsoup 和 pandas 找到这些文件的链接之前。
感谢您的各种回答!
【问题讨论】:
-
您能解释一下为什么在 HTML 源代码中找不到链接吗?我不确定我是否清楚这里的目标。
-
嗨,亚历克斯 W!制作页面的开发者并没有直接在 HTML 源代码中编写链接,而是在点击时调用。我希望这些链接收集所有数据,并将它们合并到一张 Excel 表中。感谢您的回复!
标签: python python-3.x hyperlink screen-scraping google-crawlers