【发布时间】:2017-08-27 03:01:44
【问题描述】:
我目前正在使用 Selenium 从一些网站抓取数据。与 urllib 不同,我似乎并不需要像 BeautifulSoup 这样的解析器来解析 HTML。我可以简单地使用 Selenium 找到一个元素并使用 Webelement.text 来获取我需要的数据。正如我所看到的,有些人在网络爬虫中同时使用 Selenium 和 BeautifulSoup。真的有必要吗? bs4 可以提供哪些特殊功能来改进爬取过程?谢谢。
【问题讨论】:
-
stackoverflow.com/questions/17436014/…我已经阅读了这篇文章,我目前正在爬的都是动态网站,所以我必须使用Selenium而不是urllib2
标签: python selenium beautifulsoup web-crawler urllib2