【发布时间】:2016-07-01 04:03:49
【问题描述】:
假设我正在抓取一个 url
http://www.engineering.careers360.com/colleges/list-of-engineering-colleges-in-India?sort_filter=alpha
它不包含包含我要抓取的数据的页面。那么我怎样才能抓取所有下一页的数据。 我正在使用 python 3.5.1 和 Beautifulsoup。 注意:我不能使用 scrapy 和 lxml,因为它会给我一些安装错误。
【问题讨论】:
标签: python html web-scraping beautifulsoup html-parsing