【发布时间】:2011-08-26 20:58:46
【问题描述】:
我需要一个相当容易使用的无头浏览器(我对 Python 和一般编程还很陌生),它允许我导航到一个页面,登录到一个需要 Javascript 的表单,然后抓取结果通过搜索符合特定条件的结果、单击复选框并单击下载文件来访问网页。所有这些都需要 Javascript。
我听说我想要一个无头浏览器 - 要求/偏好是我能够从 Python 运行它,并且最好是生成的脚本可以由 py2exe 编译(我正在为其他用户编写这个程序)。
到目前为止,Windmill 看起来可能是我想要的,但我不确定。
任何想法表示赞赏!
【问题讨论】:
-
对不起,据我所知这不存在(还)。你现在能做的最好的就是运行 webdriver,从 Python 接口驱动。你可以用这种方式驱动 HtmlUnit,但它是用 Java 编写的,所以你有 Java 和 Python 的组合。
标签: javascript python screen-scraping headless-browser