【发布时间】:2015-09-23 08:03:20
【问题描述】:
我对网络抓取、scrapy 和 python 还很陌生。我试图从这个website page 中抓取数据。
我想提取页面页脚中给出的电子邮件 ID:info@bikramyogasg.com,并尝试使用两个 xpath 在 scrapy spider 中提取此 ID:
- 相对:id("gkFooterNav")/div/p/span/a/text()
- 绝对:/html/body/div[4]/div1/div/div/div/p/span/a/text()
我已经尝试过这些 xpath 有和没有 'text()' 的最后一个组件。这些都不起作用,蜘蛛返回一个空列表。
但是,当我使用 xpath 检查器检查这些时,我得到了正确的值。无法弄清楚这里出了什么问题。有人可以帮忙吗?
谢谢, 图希娜
【问题讨论】: