【问题标题】:What's the easiest way to download the source of a webpage in python? (After javascript has been applied)在python中下载网页源代码的最简单方法是什么? (应用 javascript 后)
【发布时间】:2011-05-30 22:50:35
【问题描述】:

在python中:

我想在应用 javascript 后下载网页的源代码。最简单的方法是什么?

【问题讨论】:

    标签: javascript python html http rest


    【解决方案1】:

    splinter 是最简单的方法:

    from splinter.browser import Browser
    browser = Browser()
    browser.visit('http://google.com')
    

    splinter 是一个工具,可以让使用几个成熟的产品变得更容易使用。像 Selenium 这样的东西需要很多时间来适应。 splinter 允许您学习一种 API 以使用 webdriver 或更改为 zope.testbrowser 如果您愿意。

    您可以运行 JavaScript 并更改页面或测试其结果:

    browser.execute_script("$('body').empty()")
    browser.evaluate_script("4+4") == 8
    

    【讨论】:

    • 它是否适用于 cookie?例如,我可以使用它登录 Facebook 吗?另外,假设在 $function(){ $("div.test").html("abc") } ;我可以用
      abc
      得到一个字符串(源代码)对吗?
    • 这篇博文讨论了登录 Facebook franciscosouza.com/2011/05/…
    • +1 非常有用的答案。开启无限可能。 Facebook 只是一群短跑机器人吗?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-07-11
    • 1970-01-01
    相关资源
    最近更新 更多