【发布时间】:2020-02-07 21:23:47
【问题描述】:
我正在尝试分析这个网站上的数据:Electricity prices
我尝试使用 Beautiful Soup 来做到这一点:
from bs4 import BeautifulSoup
import requests
page = requests.get('https://transparency.entsoe.eu/transmission-domain/r2/dayAheadPrices/show?name=&defaultValue=false&viewType=TABLE&areaType=BZN&atch=false&dateTime.dateTime=01.10.2018+00:00%7CCET%7CDAY&biddingZone.values=CTY%7C10YAT-APG------L!BZN%7C10YAT-APG------L&dateTime.timezone=CET_CEST&dateTime.timezone_input=CET+(UTC+1)+/+CEST+(UTC+2)')
soup = BeautifulSoup(page.text, 'html.parser')
price_hide = soup.find(class_='dv-value-cell')
print(price_hide)
目前为止:
<td class="dv-value-cell">
<span onclick="showDetail('eu.entsoe.emfip.transmission_domain.r2.presentation.entity.DayAheadPricesMongoEntity', '5bb0b150623a7295d97e9b6d', '2018-09-30T22:00:00.000Z', 'PRICE', 'CET');">59.53</span>
但是我如何刮掉整张桌子呢?
【问题讨论】:
-
首先执行 price_hides = soup.find_all(class_='dv-value-cell') 以获取所有 td。然后 price_hide.text 获取价格。
标签: python html database web-scraping