【发布时间】:2026-02-15 12:00:02
【问题描述】:
对于编程来说还很陌生,道歉是一个广泛的问题。
import requests
from bs4 import BeautifulSoup
def data():
League = ['nba', 'nfl', 'mlb']
url = f"http://www.espn.com/{League[0]}/schedule"
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
date = soup.find('h2',{'class':'table-caption'})
return date.string
这是我目前所拥有的,但我想做的就是抓取今天的比赛,结果如下:
>>> 'Los Angeles Lakers at Charlotte Bobcats 7:00PM'
>>> 'Boston Celtics at Detroit Pistons 7:00PM'
我看到所有信息都在其中,但我不知道如何遍历行,以及在数据不是专门作为字符串时提取数据。我知道这是广泛的,并且有很多要求。提前道歉!
【问题讨论】:
-
了解 XPath 和使用 Web 开发工具,例如Firebug for Firefox 了解如何查找和处理网站上的特定数据。
-
XPath 是否比请求更好?还是我可以定制更多?
-
XPath 是一种处理 HTML 网页特定项目的方法。这可能会有所帮助,但取决于复杂性
soup.find可能就足够了。
标签: python python-3.x loops iterator