【发布时间】:2017-12-10 00:40:17
【问题描述】:
我正在尝试使用 BeautifulSoup 从房地产网站上抓取属性列表并将它们传递到数据表中。我正在使用 python 3。
以下代码可以打印所需的数据。但我需要一种将数据输出到表中的方法。每个 li 标签之间是 3 个项目,一个物业编号 (1 - 50),租户名称和平方英尺。理想情况下,输出将在具有列标题编号、租户、平方英尺的数据框中构建。
from bs4 import BeautifulSoup
import requests
import pandas as pd
page = requests.get("http://properties.kimcorealty.com/properties/0014/")
soup = BeautifulSoup(page.content, 'html.parser')
start = soup.find('div', {'id' : 'units_box_1'})
for litag in start.find_all('li'):
print(litag.text)
start = soup.find('div', {'id' : 'units_box_2'})
for litag in start.find_all('li'):
print(litag.text)
start = soup.find('div', {'id' : 'units_box_3'})
for litag in start.find_all('li'):
print(litag.text)
【问题讨论】:
标签: python web-scraping beautifulsoup