【发布时间】:2016-06-06 15:37:52
【问题描述】:
我是一名足球迷,正在努力学习scrapy。但是,我遇到了一些与 xpath 相关的问题,想知道是否有人可以帮忙。我在https://whoscored.com/Statistics 页面上并试图获取有关 2774 名玩家的所有信息。这听起来像是一个完全新手的问题,但我如何刮掉玩家的名字?我尝试使用
`response.xpath('//*[(@id = "player-table-statistics-body")]//*[contains(concat( " ", @class, " " ), concat( " ", "player-link", " " ))]/text()').extract()`
但它不会刮掉任何东西。我通过在 Chrome 中使用 selectorgadget 获得了 xpath。不过,
`response.xpath('//*[contains(concat( " ", @class, " " ),
concat( " ", "player-link", " " ))]/text()').extract()`
有效,但它会刮掉 Statistical XI 列表中的所有名称,这也是我不想要的。非常感谢这里的一些帮助。谢谢!
@Steve 这就是我在 scrapy shell 中所做的事情:
scrapy shell https://www.whoscored.com/Statistics
response.xpath('//*[(@id = "player-table-statistics-body")]//*[contains(@class, "player-link")]/text()').extract()
我认为这会给我我正在寻找的十个名字,但事实并非如此。在这一点上我真的一无所知!
【问题讨论】:
-
@alecxe 对不起,我的错。现在修好了。