【发布时间】:2025-12-27 23:50:06
【问题描述】:
我正在尝试抓取新的 ESPN NBA 记分牌。这是一个简单的脚本,它应该返回 15 年 4 月 5 日所有游戏的开始时间:
import requests
import lxml.html
from lxml.cssselect import CSSSelector
doc = lxml.html.fromstring(requests.get('http://scores.espn.go.com/nba/scoreboard?date=20150405').text)
#xpath
print doc.xpath("//title/text()") #print page title
print doc.xpath("//span/@time")
print doc.xpath("//span[@class='time']")
print doc.xpath("//span[@class='time']/text()")
#CCS Selector
sel = CSSSelector('span.time')
for i in sel(doc):
print i.text
它不返回任何内容,而是返回页面标题:
['NBA Basketball Scores - NBA Scoreboard - ESPN']
[]
[]
[]
有人可以帮忙吗?谢谢
【问题讨论】:
-
我写了一些刮 espn nba 的东西,github.com/GiannisIordanou/ESPN-NBA
标签: python xpath web-scraping lxml lxml.html