【发布时间】:2009-08-11 21:38:53
【问题描述】:
可能重复:
Screen Scraping from a web page with a lot of Javascript
我只想在需要 javascript 支持的网站上执行表单输入和网页抓取等任务。而且我还需要在同一个会话中输入表单、抓取等。理想情况下,我想要一种从命令行控制网络浏览器的方法。而且我还想只使用 Linux 来完成这一切,所以我不能使用 .NET。
我找到了 Python 的 webbrowser 库,但它的功能看起来非常有限。如果它可以与 mechanize 和 BeautifulSoup 交互,那就太棒了。有什么建议么?谢谢!
【问题讨论】:
标签: javascript webforms screen-scraping beautifulsoup mechanize