【发布时间】:2016-06-21 03:49:26
【问题描述】:
我正在尝试抓取this page
我的汤选择器是:
test = soup.select('#bodyContent > #mw-content-text > table.wikitable:nth-of-type(4)')
这应该返回#cmw-content-text 的第四个子表。
但它返回一个空列表。
但如果我查询:
test = soup.select('#bodyContent > #mw-content-text > table.wikitable')[3]
我确实得到了相同的选择器。
我的实现中缺少什么?
【问题讨论】:
-
也许第四个
#mw-content-text > table不是.wikitable。 :nth-of-type() 不等同于索引器。 -
是的。否则它不会出现在列表中。
标签: python web-scraping css-selectors beautifulsoup