【问题标题】:Get files attached to URL using python使用python获取附加到URL的文件
【发布时间】:2015-12-11 23:04:36
【问题描述】:

所以我有一个问题;如何从网页中获取文件以及附加到它们的 url。例如,Google.com

所以我们访问 google.com 并打开 firebug (Mozilla/chrome) 并访问“网络” 然后我们会看到每个附加文件的位置,以及文件的扩展名。

我如何在 python 中做到这一点?

对于 url 的东西,我通常会查看 urllib/mechanize/selenium,但这些似乎都不支持我想要的,或者我不知道与之关联的代码。

我正在使用 linux python 2.7 - 任何帮助/答案都会很棒。感谢任何试图回答这个问题的人。

编辑:后端服务器生成的东西,我不知道如何,但“网络”或“网络”部分中的萤火虫会显示此信息。我想知道它是否可以通过某种方式实现到 python 中。

【问题讨论】:

  • 如果我理解你的问题,你想要this

标签: python url networking request


【解决方案1】:

从外观上看,您可以从此处修改答案Download image file from the HTML page source using python?,除了修改它以在<script>(用于js)和<link>(用于css)中查找url以及您需要的任何其他内容。

【讨论】:

    【解决方案2】:

    解析网页并找到所有“附加”文件的链接并不难,例如(css,图标,js,图像等),这些文件将由浏览器获取,您可以在'中看到它们网络”面板。

    更难的部分是一些文件是由 javascript 使用 ajax 获取的。做到这一点(完全正确)的唯一方法是模拟我认为 python 做不到的浏览器(解析 html+css 并运行 javascripts)。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-10-11
      • 1970-01-01
      • 1970-01-01
      • 2011-05-03
      • 2019-07-04
      • 2020-02-29
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多