【发布时间】:2019-01-15 10:12:11
【问题描述】:
我是数据抓取的新手,我检查了一些关于 scrapy 和 beautifulsoup 的资源,但我正在努力解决以下问题。
起始页网址是here。
我想要每个项目的价格、地毯等信息,然后点击项目链接
现在我需要收集概览、便利设施、规格等部分中的内容,然后返回上一个列表页面并对该页面上列出的所有项目重复此操作。此外,点击下一步按钮并对所有条目重复相同的操作。
请告诉我如何在 python 中为这个用例实现抓取算法。这是我尝试过的一个非常基本的级别代码:
> import pandas as pd from pandas
> import ExcelWriter
> import requests,re,csv from bs4
> import BeautifulSoup
>
> for i in range(1,5): # Number of pages plus one
>
> url = "https://www.commonfloor.com/listing-search?city=Mumbai&search_intent=sale&property_location_filter%5B%5D=region_52c256ec1614d&prop_name%5B%5D=Kandivali%20West&polygon=1&page=1&page_size=30".format(i);
>
> r = requests.get(url)
> soup = BeautifulSoup(r.content)
【问题讨论】:
-
请贴出你目前写的代码,具体在哪里需要帮助。
标签: python web-scraping beautifulsoup