【发布时间】:2020-04-08 23:41:11
【问题描述】:
我正在开展一个项目,以获取有关在比赛前有多少狗被撤回的数据库。 我需要抓取数据然后写入 csv。 我的问题是我正在抓取的数据有图像而不是文本(在网页上的 PLC 和 Greayhound 之间)。 这意味着我运行 2 个不同的循环来获取我需要的信息,然后很难将其连接回正确的位置。
这里是代码。
import requests
import csv
URL = "https://www.thedogs.com.au/Racing/MeetResults.aspx?meetId=255268"
page = requests.get(URL)
from bs4 import BeautifulSoup
soup = BeautifulSoup(page.text, 'html.parser')
#soup.findAll('td', class_='ResultsCenteredCellContents'):
odds=[]
dog = soup.findAll('img' )
for a in dog:
odds.append(a['src'].strip())
odds1=[]
for b in soup.findAll('td'):
odds1.append(b.text.strip())
所以,如果我可以在一个循环中运行我需要的所有代码,并且可以用 CSV 编写,那就太好了。
【问题讨论】: