【发布时间】:2012-01-09 17:32:03
【问题描述】:
对于我的第一个爬虫程序,我计划执行以下操作:
- 使用 Selenium 打开以下 URL:http://www.google.com/
- 收集所有相关链接
- 在结果页面上,列举所有存在的 http 链接并将它们存储在 csv 中。
- 返回第 2 步,但点击下一步
我该如何开始? (我使用的是 Python 2.6.6)。
【问题讨论】:
-
在这个网站上使用硒是多余的。站点没有任何动态(ajax)内容。如果这是您的第一个任务,请尝试mechanize 文档中有示例
标签: python selenium web-crawler