【发布时间】:2015-07-23 10:18:54
【问题描述】:
在我的解析函数中,这是我编写的代码:
hs = Selector(response)
links = hs.xpath(".//*[@id='requisitionListInterface.listRequisition']")
items = []
for x in links:
item = CrawlsiteItem()
item["title"] = x.xpath('.//*[contains(@title, "View this job description")]/text()').extract()
items.append(item)
return items
并且标题返回一个空列表。
我正在捕获一个在链接中带有 id 标记的 xpath,然后在链接标记中,我想获取具有查看此职位描述的标题的所有值的列表。
请帮我修复代码中的错误。
【问题讨论】:
-
你有没有把
x的内容打印到控制台看是否包含你要搜索的title的元素? -
我已将其输出到 csv 文件,并在文件中仅返回标题作为列标题,其下方为空。
-
我的意思是在您的代码中,您可以验证 Scrapy 获取的站点是否确实包含您想要的信息。例如,在
for循环中执行print x来查看x的内容是什么,看看是否找到了正确的元素。 -
HTML 有一个带有 id 的 table 标签,正如提到的其他一些属性。下面有一个 tbody ,tr 标签,我试图在其中获取数据。所以,在这种情况下,我有我的输出为
-
将此视为可用的 html 代码的一部分 关联