【发布时间】:2019-01-09 12:45:09
【问题描述】:
我正在使用 scrapy 编写爬虫,并通过使用以下 python 行,我设法获取了我正在寻找的数据:
Python 行:
response.css("article.college div.span8.profile > table > tbody > tr").extract()
它返回以下结果:
['<tr>\n<th>Institution Name:</th>\n<td>Harvard University</td>\n</tr>',
'<tr>\n<th>Administration</th>\n<td>Private</td>\n</tr>',
'<tr>\n<th>State</th>\n<td>\nMassachussets\t\n</td>\n</tr>']
但是,我想访问按属性名称索引的属性值。我想做这样的事情:
response.css(<magic containing 'Institution Name'>)
并且能够检索到对应的值,在本例中是这样的:
\n<td>Harvard University</td>\n
有人可以帮我解决这个问题吗?
谢谢
【问题讨论】:
标签: css web-scraping scrapy css-selectors